CN112836000A - 基于出租车od数据的非常态居民出行模式挖掘方法 - Google Patents

基于出租车od数据的非常态居民出行模式挖掘方法 Download PDF

Info

Publication number
CN112836000A
CN112836000A CN202110120448.7A CN202110120448A CN112836000A CN 112836000 A CN112836000 A CN 112836000A CN 202110120448 A CN202110120448 A CN 202110120448A CN 112836000 A CN112836000 A CN 112836000A
Authority
CN
China
Prior art keywords
data
tensor
matrix
model
rank
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110120448.7A
Other languages
English (en)
Inventor
王立春
张彬
王少帆
孔德慧
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202110120448.7A priority Critical patent/CN112836000A/zh
Publication of CN112836000A publication Critical patent/CN112836000A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Library & Information Science (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Remote Sensing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

基于出租车OD数据的非常态居民出行模式挖掘方法属于智能交通和数据挖掘领域。为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本发明提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。

Description

基于出租车OD数据的非常态居民出行模式挖掘方法
技术领域
本发明属于智能交通和数据挖掘领域,具体涉及市区居民的非常态出行规律挖掘方法。
背景技术
随着信息技术的快速发展和无处不在的数据,在空间和时间尺度上记录人类个体活动的位置及轨迹数据已经成为可能。在大数据的驱动下,这些位置信息不仅帮助规划人员和研究人员将城市理解为复杂的系统,而且还允许研究人员通过以数据为中心的技术来理解人类活动的规律。这种移动数据的出现确实带来了将更多信息整合到决策中去的机会。然而,数据的复杂性也随其内容的维数而增加,这意味着空间、时间和社会属性之间存在复杂的依赖关系和高阶相互作用。考虑到出租车作为城市中的重要交通工具之一,通过出租车OD数据了解城市居民的出行需求是理解城市人类活动规律的重要途径。随着大数据的发展,近十几年来针对人类移动规律的研究越来越多。由于数据的多样性,研究人员通过多种不同的载体跟踪人类移动。Marta C.等人通过对手机信号定位的跟踪来追寻人类的移动轨迹,发现他们的移动轨迹服从幂律分布,同时对轨迹访问点的概率密度做了可视化,发现研究人群总是出现在特定的轨迹路线并访问特定的地点;随后Marta C.为了发现更宏观的移动规律和Filippo等人对美国政府提供的人口普查数据进行研究,发现居民在求职时,在距离居住地近的基础上更倾向于人口密度大的城市。这种规律类似于引力模型,也就是说两地间通勤流量和两地距离成反比而与人口数量成正比,这个规律同样适用于人口迁徙以及货物运输等;Luca等人通过对私家车GPS定位的追踪发现存在两个截然不同特征的人类流动性:“回归者”和“探索者”。“回归者”将他们的大部分流动性限制在几个地点,相反“探索者”总是涉足更多的新地点。随着社交网络的发展,网站门户的登录记录同样能从记录用户的定位。例如,Yan等人使用微博等网站的登录信息进行研究,建立了吸引力模型,该模型同时从个体和宏观层面对网站用户的移动规律进行了总结。但是这几种模型只能粗略统计人群的出行规律,由于调查载体的不稳定性很容易得到错误数据或丢失数据。
为了得到居民日常的出行数据,研究人员对公交车乘客刷卡数据进行研究。考虑到雨雪天气对居民出行有着重要影响,为了探索天气变化对公交乘客出行的影响,Sui等人对自回归滑动平均(Autoregressive Integrated Moving Average model,ARIMA)模型进行改进,得到了研究外部变量对时间序列影响的周期性模型,该模型包含了周期和非周期自相关性,很好地模拟了天气对每小时交通客流量的影响。区域层次的流动模式可以提供关于人们如何聚集或离开该区域的更宏观和直观的知识,Qi等人通过对公交车站点进行聚类,把范围内的站牌聚类为区域,并引入了Point of Interest(POI)数据为每个区域分配了功能属性,实现了基于区域属性的区域流动模式的分析和预测。刘耀林等人基于公交刷卡数据,以武汉市主城区和都市发展区为研究区,通过构建出行模型和职住地识别规则,识别了职住通勤群体,从职住密度、通勤时间与距离、通勤流向和可视化等方面对武汉市的通勤出行和职住平衡进行测度,并识别了武汉市的职住通勤模式。Pan等人使用自回归滑动模型对杭州市区热点乘客数量预测并做测点推荐,但是他们仅考虑了出租车历史数据而忽略了影响乘客出行的天气因素。Pang等人通过对市区进行网格划分,构建了空间模式下的出租车OD矩阵,并通过稀疏分解得到空间非常态出行模式。但是这种分析方法仅仅考虑了空间下出行规律,而忽略了城市区功能区对于乘客出行的潜在影响。
发明内容
为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本发明提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。
本发明提出一种基于稀疏张量分解模型的乘客出行规律挖掘方法,整体框架如图1所示。首先对原始数据进行预处理,提取滴滴打车每条数据中的起点-终点即O-D点,对研究区域做功能区划分,分类为住宅区、商业区、学校等11类区域属性;把从O-D数据中提取的时间、空间数据结合其所属的功能区构成三阶张量,张量中每个单位表示当前时间段内某个位置的某个区域,如上午九点到九点半北二环某个商场的打车数据量;对张量模型做低秩稀疏分解,得到低秩和稀疏模式两个模型,并对其做Tucker分解得到基底矩阵;对时间、空间、功能区基底矩阵分别做可视化分析。
本发明所提出方法的具体步骤如下:
1)数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点(O-D数据)的时间和经纬度信息。研究区域总共包括8km*8km的正方形区域,对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖。总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学。
2)构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量。在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据。三阶张量中每个单位格子中表示某时间段内某个位置的某个区域如上午九点到九点半北二环某个商)的打车数据量。
3)低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量。常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似。而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低。
Figure RE-GDA0003027916620000032
为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3。通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即
Figure RE-GDA0003027916620000031
目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,||||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1,×2,×3表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4 和时间的基底矩阵,维度为17×3,0.1≤α<1为稀疏与低秩约束的权重,从 0.1到1寻求最优值,i=1,2时分别执行约束条件。
4)低秩稀疏张量分解模型求解:
为求解(1),在此引入辅助变量Vi',Fi',Ti',i=1,2,辅助变量与V,F,T维度相同,通过初始化随机值赋值来迭代求取最优值,在约束条件中加上约束使辅助变量值逼近原矩阵。把模型(1)改写为
Figure RE-GDA0003027916620000041
使用乘子法对模型(2)求解,将其转化为如下的增广拉格朗日函数:
Figure RE-GDA0003027916620000042
其中,<·,·>表示两个矩阵的内积运算,β为对应于约束条件D=D1+D2的拉格朗日乘子,β1,β2分别为Di=Ai×1Vi×2Fi×3Ti的乘子。矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为,17×3。μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大。在此采用交替方向法求解(2)。具体分为如下几个子问题。
子问题D1求解低秩模型:
Figure RE-GDA0003027916620000043
取中间变量
Figure RE-GDA0003027916620000044
对其做SVD分解求得奇异值矩阵
Figure RE-GDA0003027916620000045
利用软阈值函数,
Figure RE-GDA0003027916620000046
的奇异值矩阵σ1的闭合解为:
Figure RE-GDA0003027916620000047
其中sign,*,|·|和max均对矩阵逐元素进行运算,其中sign表示元素为正时取1,max表示取最大值。μ为惩罚参数,初始值为1,在每次迭代中以1.05 倍速度增大。利用奇异值矩阵解得到
Figure RE-GDA0003027916620000048
后对矩阵折叠可以得到张量D1
子问题D2求解:
Figure RE-GDA0003027916620000051
取中间变量
Figure RE-GDA0003027916620000052
利用软阈值函数,(6) 的闭合解为:
Figure RE-GDA0003027916620000053
μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大。解得D2
子问题Vi,i=1,2求解位置基底矩阵,维度为1600×6:
Figure RE-GDA0003027916620000054
对张量取模一展开将式(8)转化为:
Figure RE-GDA0003027916620000055
利用公式
Figure RE-GDA0003027916620000056
把(9)的目标函数转化为:
Figure RE-GDA0003027916620000057
其中
Figure RE-GDA0003027916620000058
表示F范数,tr(·)表示取方阵的迹。
使用SVD分解,令
Figure RE-GDA0003027916620000059
则:
Vi=PQT (11)
其中P,Q为svd分解的左右奇异值矩阵。
子问题Fi,i=1,2求解功能区基底矩阵,维度为1600×6:
Figure RE-GDA00030279166200000510
对张量取模二展开将式(12)转化为:
Figure RE-GDA00030279166200000511
把(13)的目标函数转化为:
Figure RE-GDA00030279166200000512
Figure RE-GDA0003027916620000061
则:
Fi=PQT (15)
其中P,Q为svd分解的左右奇异值矩阵。
子问题Ti,i=1,2求解,时间基底矩阵维度为1600×6:
Figure RE-GDA0003027916620000062
对张量取模三展开将式(16)变为:
Figure RE-GDA0003027916620000063
将式(17)的目标函数转化为:
Figure RE-GDA0003027916620000064
Figure RE-GDA0003027916620000065
则:
Ti=PQT (19)
其中P,Q为svd分解的左右奇异值矩阵。
子问题Vi',i=1,2:
Figure RE-GDA0003027916620000066
μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大。λi为该子问题乘子,其闭合解为
Figure RE-GDA0003027916620000067
子问题Fi',i=1,2:
Figure RE-GDA0003027916620000068
λi为该子问题乘子,其闭合解为
Figure RE-GDA0003027916620000069
子问题Ti',i=1,2:
Figure RE-GDA0003027916620000071
λi为该子问题乘子,其闭合解为
Figure RE-GDA0003027916620000072
最后进行乘子更新及罚参更新。
模型(2)的求解算法见算法1。
算法1:
输入:
Figure RE-GDA0003027916620000073
β,β12(分别子问题乘子)
输出:V1,F1,T1,V2,F2,T2
从k=1开始迭代:
通过(5)计算奇异值矩阵σ1
计算矩阵
Figure RE-GDA0003027916620000074
得到张量D1
通过(7)计算张量D2
从i=1到i=2:
分别计算子问题求解Vi,Fi,Ti,Vi',Fi',Ti'矩阵
通过(10)(11)计算Vi
通过(14)(15)计算Fi
通过(18)(19)计算Ti
通过(20)计算Vi'
通过(21)计算Fi'
通过(22)计算Ti'
更新乘子βi=βi-μ(Di-Ai×1Vi×2Fi×3Ti)
λi'=λi'-μ(Vi-Vi')
λi”=λi”-μ(Fi-Fi')
λi”'=λi”'-μ(Ti-Ti')
end
更新乘子β=β-μ(D-D1-D2)
更新罚参μ=min(μ_max,μ*ρ),μ为惩罚参数,初始值为1,在每次迭代中以ρ倍速度增大,ρ取值为1.05。
结束
附图说明
图1本专利整体框架
图2功能区模式可视化
图3时间模式可视化
具体实施方式
数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点 (O-D数据)的时间和经纬度信息。研究区域总共包括8km*8km的正方形区域,在此对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖。总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学。
功能区划分完成后需要把每条O-D数据加上区域属性信息,即该数据从什么区域出发最后到达什么属性的区域。在此把每条数据映射到划分好的功能区图像上,使用图像像素坐标表示经纬度坐标。此时出现两种情况:数据点在划分好的功能区内;数据点在功能区外。对于在功能区内的数据,根据每个数据所像素的颜色就可以直接归为该功能区,因为每种颜色对应一种功能区。而对于在功能区外的数据,在此需要把它归类到合理的区域内,因此需要根据具体时间段分析其真实反应的乘客的出行目的。例如对于早上通勤时间段,起点数据若处于住宅区和商业区中间,则把90%数据归为住宅区剩下的少部分数据归为商业区,因为考虑到早上居民出门通勤等原因,更多的数据来源于住宅区。依此最后把所有属于归类到对应功能区内。
构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量。在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据。三阶张量中每个单位格子中表示某时间段内某个位置的某个区域,如上午九点到九点半北二环某个商场的打车数据量。在这里取了一周里工作日的每天6点到晚上23点时间段内的数据来做实验,即时间长度为17*5。
低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量。常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似。而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低。
Figure RE-GDA0003027916620000081
为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3。在此通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即
Figure RE-GDA0003027916620000091
目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,||||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3,α为稀疏与低秩约束的权重,取值范围α>0。 i=1,2时分别执行约束条件。
低秩稀疏张量分解模型求解:求解方式即按照技术方案中的算法来求。
非常态出行模式可视化分析:对非常态张量模型做Tucker分解后的基底矩阵分别做可视化,分解后核张量维度设置为6*4*3。即六种空间模式、四种功能区模式、三种时间模式,在此以起点为例分析。
功能区模式:在研究区域内将功能区划分为11类:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学。几种非常态模式下各功能区乘客比例如图2所示,在几种模式中都出现了大学,这说明大学周围非常态出行较多,这可能是由于大学的开放性和受大学生出门不固定性等因素影响。大部分模式中都出现了居民区,而且出现时占比较大,居民区存在较多非常态出行可能受非通勤人群影响,他们不会在规律的时间段出行。模式一种几乎出现了所有功能区,产生这种现象的原因可能是受某个时间段影响较大,例如晚上,居民时间比较自由,随机性强。
空间模式:对六种空间模式(位置信息)可视化在结果中用三角形标记为火车站和汽车站,圆形标记为两所大学,箭头标记为较为集中办公区,星标为集中商业区。模式一和模式四非常态模式出现的位置相似,包含了较多的商业区、景区和大学的位置,这表明在景区附近每天乘客需求量却很难固定,而大学由于其开放性和学生时间比较自由也会造成这种非常态模式出现。模式二中较多区域较多区域出现非常态模式,这对应了功能区模式一出现的情况,可能在某个时间段内居民出行不受约束,出现很强随机性。在模式三和模式五包含了很多住宅区,由于非通勤人员出行随机性,很难确定什么时间段会出门所以在一些功能区也会出现非常态模式,这种模式和时间模式二相对应。
时间模式:对于时间在此分出三种异常模式如图3所示,其中模式一(圆形)主要出现在下午和晚上时间段,而模式二(三角形)主要出现在白天几乎每隔三个小时出现一次。认为这两种模式主要为非通勤人群和学生主导,与出现在居民区和大学的数据相关联,由于其白天各时间段都有出行数据,模式二更可能与居民区有关。而模式三(方形)主要出现在上午而后面时间段几乎不再出现,这种模式的出现可能与某些公司错峰上班有关。
综上分析,本发明提出的居民非常态出行模式分析方法优于传统的方法,它不仅挖掘了时间空间两个维度的出行模式规律,还挖掘了不同功能区的乘客出行模式以及与之对应的出行驱动因素。从方法上,使用张量表示数据更直观的表示了出租车OD数据各个维度之间的联系,Tucker分解得到的基底矩阵可以更好的反应各模式下的出行规律,不同模式的可视化也可以更直观地展示非常态模式和其相关性,同时计算速度也优于传统方法。通过对非常态出行模式的挖掘,可以相应的对出租车进行调度,不仅避免出现乘客堆积的状况,还能相应的提高出租车利用率以及出租车运营效益。

Claims (1)

1.基于出租车OD数据的非常态居民出行模式挖掘方法,其特征在于:
1)数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点O-D数据的时间和经纬度信息;研究区域总共包括8km*8km的正方形区域,对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖;总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学;
2)构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量;在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据;三阶张量中每个单位格子中表示某时间段内某个位置的某个区域的打车数据量;
3)低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量;常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似;而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低;
Figure FDA0002922156050000012
为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3;通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即
Figure FDA0002922156050000011
目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,|| ||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1,×2,×3表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3,0.1≤α<1为稀疏与低秩约束的权重,从0.1到1寻求最优值,i=1,2时分别执行约束条件;
4)低秩稀疏张量分解模型求解:
为求解(1),在此引入辅助变量Vi′,Fi′,Ti′,i=1,2,辅助变量与V,F,T维度相同,通过初始化随机值赋值来迭代求取最优值,在约束条件中加上约束使辅助变量值逼近原矩阵;把模型(1)改写为
Figure FDA0002922156050000021
使用乘子法对模型(2)求解,将其转化为如下的增广拉格朗日函数:
Figure FDA0002922156050000022
其中,<·,·>表示两个矩阵的内积运算,β为对应于约束条件D=D1+D2的拉格朗日乘子,β1,β2分别为Di=Ai×1Vi×2Fi×3Ti的乘子;矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为,17×3;μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;在此采用交替方向法求解(2);具体分为如下几个子问题;
子问题D1求解低秩模型:
Figure FDA0002922156050000031
取中间变量
Figure FDA0002922156050000032
对其做SVD分解求得奇异值矩阵
Figure FDA0002922156050000033
利用软阈值函数,
Figure FDA0002922156050000034
的奇异值矩阵σ1的闭合解为:
Figure FDA0002922156050000035
其中sign,*,|·|和max均对矩阵逐元素进行运算,其中sign表示元素为正时取1,max表示取最大值;μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;利用奇异值矩阵解得到
Figure FDA0002922156050000036
后对矩阵折叠得到张量D1
子问题D2求解:
Figure FDA0002922156050000037
取中间变量
Figure FDA0002922156050000038
利用软阈值函数,(6)的闭合解为:
Figure FDA0002922156050000039
μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;解得D2
子问题Vi,i=1,2求解位置基底矩阵,维度为1600×6:
Figure FDA00029221560500000310
对张量取模一展开将式(8)转化为:
Figure FDA00029221560500000311
利用公式
Figure FDA0002922156050000041
把(9)的目标函数转化为:
Figure FDA0002922156050000042
其中
Figure FDA0002922156050000043
表示F范数,tr(·)表示取方阵的迹;
使用SVD分解,令
Figure FDA0002922156050000044
则:
Vi=PQT (11)
其中P,Q为svd分解的左右奇异值矩阵;
子问题Fi,i=1,2求解功能区基底矩阵,维度为1600×6:
Figure FDA0002922156050000045
对张量取模二展开将式(12)转化为:
Figure FDA0002922156050000046
把(13)的目标函数转化为:
Figure FDA0002922156050000047
Figure FDA0002922156050000048
则:
Fi=PQT (15)
其中P,Q为svd分解的左右奇异值矩阵;
子问题Ti,i=1,2求解,时间基底矩阵维度为1600×6:
Figure FDA0002922156050000049
对张量取模三展开将式(16)变为:
Figure FDA00029221560500000410
将式(17)的目标函数转化为:
Figure FDA0002922156050000051
Figure FDA0002922156050000052
则:
Ti=PQT (19)
其中P,Q为svd分解的左右奇异值矩阵;
子问题Vi′,i=1,2:
Figure FDA0002922156050000053
μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;λi为该子问题乘子,其闭合解为
Figure FDA0002922156050000054
子问题Fi′,i=1,2:
Figure FDA0002922156050000055
λi为该子问题乘子,其闭合解为
Figure FDA0002922156050000056
子问题Ti′,i=1,2:
Figure FDA0002922156050000057
λi为该子问题乘子,其闭合解为
Figure FDA0002922156050000058
最后进行乘子更新及罚参更新;
模型(2)的求解算法见算法1;
算法1:
输入:
Figure FDA0002922156050000061
(分别子问题乘子)
输出:V1,F1,T1,V2,F2,T2
从k=1开始迭代:
通过(5)计算奇异值矩阵σ1
计算矩阵D1(3)得到张量D1
通过(7)计算张量D2
从i=1到i=2:
分别计算子问题求解Vi,Fi,Ti,Vi′,Fi′,Ti′矩阵
通过(10)(11)计算Vi
通过(14)(15)计算Fi
通过(18)(19)计算Ti
通过(20)计算Vi
通过(21)计算Fi
通过(22)计算Ti
更新乘子βi=βi-μ(Di-Ai×1Vi×2Fi×3Ti)
λ′i=λ′i-μ(Vi-Vi′)
λi″=λ″i-μ(Fi-Fi′)
λ″′i=λ″′i-μ(Ti-Ti')
更新乘子β=β-μ(D-D1-D2)
更新罚参μ=min(μ_max,μ*ρ),μ为惩罚参数,初始值为1,在每次迭代中以ρ倍速度增大,ρ取值为1.05;
结束。
CN202110120448.7A 2021-01-28 2021-01-28 基于出租车od数据的非常态居民出行模式挖掘方法 Pending CN112836000A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110120448.7A CN112836000A (zh) 2021-01-28 2021-01-28 基于出租车od数据的非常态居民出行模式挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110120448.7A CN112836000A (zh) 2021-01-28 2021-01-28 基于出租车od数据的非常态居民出行模式挖掘方法

Publications (1)

Publication Number Publication Date
CN112836000A true CN112836000A (zh) 2021-05-25

Family

ID=75932147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110120448.7A Pending CN112836000A (zh) 2021-01-28 2021-01-28 基于出租车od数据的非常态居民出行模式挖掘方法

Country Status (1)

Country Link
CN (1) CN112836000A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227791A (zh) * 2023-05-08 2023-06-06 湖南工商大学 基于语义融合模型探索城市功能区动态划分的可视分析方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910017A (zh) * 2017-02-21 2017-06-30 深圳供电局有限公司 一种基于用户行为数据挖掘的电能体验分析方法和系统
CN107992536A (zh) * 2017-11-23 2018-05-04 中山大学 基于张量分解的城市交通缺失数据填补方法
CN109241491A (zh) * 2018-07-28 2019-01-18 天津大学 基于联合低秩和稀疏表示的张量结构性缺失填充方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106910017A (zh) * 2017-02-21 2017-06-30 深圳供电局有限公司 一种基于用户行为数据挖掘的电能体验分析方法和系统
CN107992536A (zh) * 2017-11-23 2018-05-04 中山大学 基于张量分解的城市交通缺失数据填补方法
CN109241491A (zh) * 2018-07-28 2019-01-18 天津大学 基于联合低秩和稀疏表示的张量结构性缺失填充方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘菊;许;蔡玲;孟斌;裴韬;: "基于出租车用户出行的功能区识别", 地球信息科学学报, no. 11, 28 November 2018 (2018-11-28), pages 14 - 25 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116227791A (zh) * 2023-05-08 2023-06-06 湖南工商大学 基于语义融合模型探索城市功能区动态划分的可视分析方法
CN116227791B (zh) * 2023-05-08 2023-09-05 湖南工商大学 基于语义融合模型探索城市功能区动态划分的可视分析方法

Similar Documents

Publication Publication Date Title
Liu et al. Contextualized spatial–temporal network for taxi origin-destination demand prediction
Chen et al. Predicting station level demand in a bike‐sharing system using recurrent neural networks
Li et al. A hierarchical temporal attention-based LSTM encoder-decoder model for individual mobility prediction
Hua et al. Estimating the parking demand of free-floating bike sharing: A journey-data-based study of Nanjing, China
CN110414747B (zh) 一种基于深度学习的时空长短期城市人流量预测方法
Du et al. Spatiotemporal exploration of the non-linear impacts of accessibility on metro ridership
Kohan et al. Discovering traffic congestion through traffic flow patterns generated by moving object trajectories
CN110837973B (zh) 一种基于交通出行数据的人类出行选择信息挖掘方法
CN111160622A (zh) 基于混合神经网络模型的景区客流预测方法和装置
Zhao et al. Coupling graph deep learning and spatial-temporal influence of built environment for short-term bus travel demand prediction
Tian et al. Dynamic evolution of demand fluctuation in bike-sharing systems for green travel
Pang et al. Development of people mass movement simulation framework based on reinforcement learning
Cheng et al. Developing a travel time estimation method of freeway based on floating car using random forests
Zou et al. Estimation of travel time based on ensemble method with multi-modality perspective urban big data
CN114897444A (zh) 一种城市分区域内服务设施需求识别方法及系统
Wang et al. Urban traffic pattern analysis and applications based on spatio-temporal non-negative matrix factorization
Saputra et al. Accessibility model of BRT stop locations using Geographically Weighted regression (GWR): A case study in Banjarmasin, Indonesia
Alizadeh et al. On the role of bridges as anchor points in route choice modeling
Ma et al. Investigating the impact of spatial-temporal grid size on the microscopic forecasting of the inflow and outflow gap in a free-floating bike-sharing system
Xu et al. A taxi dispatch system based on prediction of demand and destination
CN112836000A (zh) 基于出租车od数据的非常态居民出行模式挖掘方法
Zhang et al. Gof-tte: Generative online federated learning framework for travel time estimation
CN112801340A (zh) 一种基于多层级城市信息单元画像的人群密度预测方法
Corradini et al. Tangramob: an agent-based simulation framework for validating urban smart mobility solutions
Czado et al. Modelling transport mode decisions using hierarchical logistic regression models with spatial and cluster effects

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination