CN112836000A - 基于出租车od数据的非常态居民出行模式挖掘方法 - Google Patents
基于出租车od数据的非常态居民出行模式挖掘方法 Download PDFInfo
- Publication number
- CN112836000A CN112836000A CN202110120448.7A CN202110120448A CN112836000A CN 112836000 A CN112836000 A CN 112836000A CN 202110120448 A CN202110120448 A CN 202110120448A CN 112836000 A CN112836000 A CN 112836000A
- Authority
- CN
- China
- Prior art keywords
- data
- tensor
- matrix
- model
- rank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 26
- 238000000034 method Methods 0.000 title claims abstract description 19
- 238000005065 mining Methods 0.000 title claims abstract description 6
- 239000011159 matrix material Substances 0.000 claims abstract description 49
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 30
- 238000011160 research Methods 0.000 claims abstract description 8
- 238000007781 pre-processing Methods 0.000 claims description 7
- 239000000758 substrate Substances 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000003086 colorant Substances 0.000 claims description 3
- 230000003203 everyday effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 230000003190 augmentative effect Effects 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 238000007418 data mining Methods 0.000 abstract description 2
- 241000282414 Homo sapiens Species 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 238000012800 visualization Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 239000000969 carrier Substances 0.000 description 2
- 230000002354 daily effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Computing Systems (AREA)
- Library & Information Science (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Remote Sensing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
基于出租车OD数据的非常态居民出行模式挖掘方法属于智能交通和数据挖掘领域。为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本发明提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。
Description
技术领域
本发明属于智能交通和数据挖掘领域,具体涉及市区居民的非常态出行规律挖掘方法。
背景技术
随着信息技术的快速发展和无处不在的数据,在空间和时间尺度上记录人类个体活动的位置及轨迹数据已经成为可能。在大数据的驱动下,这些位置信息不仅帮助规划人员和研究人员将城市理解为复杂的系统,而且还允许研究人员通过以数据为中心的技术来理解人类活动的规律。这种移动数据的出现确实带来了将更多信息整合到决策中去的机会。然而,数据的复杂性也随其内容的维数而增加,这意味着空间、时间和社会属性之间存在复杂的依赖关系和高阶相互作用。考虑到出租车作为城市中的重要交通工具之一,通过出租车OD数据了解城市居民的出行需求是理解城市人类活动规律的重要途径。随着大数据的发展,近十几年来针对人类移动规律的研究越来越多。由于数据的多样性,研究人员通过多种不同的载体跟踪人类移动。Marta C.等人通过对手机信号定位的跟踪来追寻人类的移动轨迹,发现他们的移动轨迹服从幂律分布,同时对轨迹访问点的概率密度做了可视化,发现研究人群总是出现在特定的轨迹路线并访问特定的地点;随后Marta C.为了发现更宏观的移动规律和Filippo等人对美国政府提供的人口普查数据进行研究,发现居民在求职时,在距离居住地近的基础上更倾向于人口密度大的城市。这种规律类似于引力模型,也就是说两地间通勤流量和两地距离成反比而与人口数量成正比,这个规律同样适用于人口迁徙以及货物运输等;Luca等人通过对私家车GPS定位的追踪发现存在两个截然不同特征的人类流动性:“回归者”和“探索者”。“回归者”将他们的大部分流动性限制在几个地点,相反“探索者”总是涉足更多的新地点。随着社交网络的发展,网站门户的登录记录同样能从记录用户的定位。例如,Yan等人使用微博等网站的登录信息进行研究,建立了吸引力模型,该模型同时从个体和宏观层面对网站用户的移动规律进行了总结。但是这几种模型只能粗略统计人群的出行规律,由于调查载体的不稳定性很容易得到错误数据或丢失数据。
为了得到居民日常的出行数据,研究人员对公交车乘客刷卡数据进行研究。考虑到雨雪天气对居民出行有着重要影响,为了探索天气变化对公交乘客出行的影响,Sui等人对自回归滑动平均(Autoregressive Integrated Moving Average model,ARIMA)模型进行改进,得到了研究外部变量对时间序列影响的周期性模型,该模型包含了周期和非周期自相关性,很好地模拟了天气对每小时交通客流量的影响。区域层次的流动模式可以提供关于人们如何聚集或离开该区域的更宏观和直观的知识,Qi等人通过对公交车站点进行聚类,把范围内的站牌聚类为区域,并引入了Point of Interest(POI)数据为每个区域分配了功能属性,实现了基于区域属性的区域流动模式的分析和预测。刘耀林等人基于公交刷卡数据,以武汉市主城区和都市发展区为研究区,通过构建出行模型和职住地识别规则,识别了职住通勤群体,从职住密度、通勤时间与距离、通勤流向和可视化等方面对武汉市的通勤出行和职住平衡进行测度,并识别了武汉市的职住通勤模式。Pan等人使用自回归滑动模型对杭州市区热点乘客数量预测并做测点推荐,但是他们仅考虑了出租车历史数据而忽略了影响乘客出行的天气因素。Pang等人通过对市区进行网格划分,构建了空间模式下的出租车OD矩阵,并通过稀疏分解得到空间非常态出行模式。但是这种分析方法仅仅考虑了空间下出行规律,而忽略了城市区功能区对于乘客出行的潜在影响。
发明内容
为了能够更好的挖掘出租车乘客出行规律,同时更深入的挖掘居民出行中存在的非常态模式,本发明提出了一种基于高维度稀疏张量分解的方法,即通过组织包括时间、经纬度、功能区属性等多维度信息为张量模型,对其进行低秩稀疏分解。为此,需要解决的关键技术问题包括:对研究区域划分功能区并把对应数据归到相应功能区内;组织时间、经纬度、功能区属性等对应数据构成张量模型;对张量模型做低秩稀疏分解,分别提取低秩模型和稀疏模型并做Tucker分解;对分解得到的基底矩阵做可视化,直观的展现乘客出行模式。
本发明提出一种基于稀疏张量分解模型的乘客出行规律挖掘方法,整体框架如图1所示。首先对原始数据进行预处理,提取滴滴打车每条数据中的起点-终点即O-D点,对研究区域做功能区划分,分类为住宅区、商业区、学校等11类区域属性;把从O-D数据中提取的时间、空间数据结合其所属的功能区构成三阶张量,张量中每个单位表示当前时间段内某个位置的某个区域,如上午九点到九点半北二环某个商场的打车数据量;对张量模型做低秩稀疏分解,得到低秩和稀疏模式两个模型,并对其做Tucker分解得到基底矩阵;对时间、空间、功能区基底矩阵分别做可视化分析。
本发明所提出方法的具体步骤如下:
1)数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点(O-D数据)的时间和经纬度信息。研究区域总共包括8km*8km的正方形区域,对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖。总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学。
2)构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量。在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据。三阶张量中每个单位格子中表示某时间段内某个位置的某个区域如上午九点到九点半北二环某个商)的打车数据量。
3)低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量。常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似。而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低。为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3。通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即
目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,||||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1,×2,×3表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4 和时间的基底矩阵,维度为17×3,0.1≤α<1为稀疏与低秩约束的权重,从 0.1到1寻求最优值,i=1,2时分别执行约束条件。
4)低秩稀疏张量分解模型求解:
为求解(1),在此引入辅助变量Vi',Fi',Ti',i=1,2,辅助变量与V,F,T维度相同,通过初始化随机值赋值来迭代求取最优值,在约束条件中加上约束使辅助变量值逼近原矩阵。把模型(1)改写为
使用乘子法对模型(2)求解,将其转化为如下的增广拉格朗日函数:
其中,<·,·>表示两个矩阵的内积运算,β为对应于约束条件D=D1+D2的拉格朗日乘子,β1,β2分别为Di=Ai×1Vi×2Fi×3Ti的乘子。矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为,17×3。μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大。在此采用交替方向法求解(2)。具体分为如下几个子问题。
子问题D1求解低秩模型:
其中sign,*,|·|和max均对矩阵逐元素进行运算,其中sign表示元素为正时取1,max表示取最大值。μ为惩罚参数,初始值为1,在每次迭代中以1.05 倍速度增大。利用奇异值矩阵解得到后对矩阵折叠可以得到张量D1。
子问题D2求解:
μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大。解得D2。
子问题Vi,i=1,2求解位置基底矩阵,维度为1600×6:
对张量取模一展开将式(8)转化为:
Vi=PQT (11)
其中P,Q为svd分解的左右奇异值矩阵。
子问题Fi,i=1,2求解功能区基底矩阵,维度为1600×6:
对张量取模二展开将式(12)转化为:
把(13)的目标函数转化为:
Fi=PQT (15)
其中P,Q为svd分解的左右奇异值矩阵。
子问题Ti,i=1,2求解,时间基底矩阵维度为1600×6:
对张量取模三展开将式(16)变为:
将式(17)的目标函数转化为:
Ti=PQT (19)
其中P,Q为svd分解的左右奇异值矩阵。
子问题Vi',i=1,2:
子问题Fi',i=1,2:
子问题Ti',i=1,2:
最后进行乘子更新及罚参更新。
模型(2)的求解算法见算法1。
算法1:
输出:V1,F1,T1,V2,F2,T2
从k=1开始迭代:
通过(5)计算奇异值矩阵σ1
通过(7)计算张量D2
从i=1到i=2:
分别计算子问题求解Vi,Fi,Ti,Vi',Fi',Ti'矩阵
通过(10)(11)计算Vi
通过(14)(15)计算Fi
通过(18)(19)计算Ti
通过(20)计算Vi'
通过(21)计算Fi'
通过(22)计算Ti'
更新乘子βi=βi-μ(Di-Ai×1Vi×2Fi×3Ti)
λi'=λi'-μ(Vi-Vi')
λi”=λi”-μ(Fi-Fi')
λi”'=λi”'-μ(Ti-Ti')
end
更新乘子β=β-μ(D-D1-D2)
更新罚参μ=min(μ_max,μ*ρ),μ为惩罚参数,初始值为1,在每次迭代中以ρ倍速度增大,ρ取值为1.05。
结束
附图说明
图1本专利整体框架
图2功能区模式可视化
图3时间模式可视化
具体实施方式
数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点 (O-D数据)的时间和经纬度信息。研究区域总共包括8km*8km的正方形区域,在此对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖。总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学。
功能区划分完成后需要把每条O-D数据加上区域属性信息,即该数据从什么区域出发最后到达什么属性的区域。在此把每条数据映射到划分好的功能区图像上,使用图像像素坐标表示经纬度坐标。此时出现两种情况:数据点在划分好的功能区内;数据点在功能区外。对于在功能区内的数据,根据每个数据所像素的颜色就可以直接归为该功能区,因为每种颜色对应一种功能区。而对于在功能区外的数据,在此需要把它归类到合理的区域内,因此需要根据具体时间段分析其真实反应的乘客的出行目的。例如对于早上通勤时间段,起点数据若处于住宅区和商业区中间,则把90%数据归为住宅区剩下的少部分数据归为商业区,因为考虑到早上居民出门通勤等原因,更多的数据来源于住宅区。依此最后把所有属于归类到对应功能区内。
构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量。在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据。三阶张量中每个单位格子中表示某时间段内某个位置的某个区域,如上午九点到九点半北二环某个商场的打车数据量。在这里取了一周里工作日的每天6点到晚上23点时间段内的数据来做实验,即时间长度为17*5。
低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量。常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似。而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低。为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3。在此通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即
目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,||||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3,α为稀疏与低秩约束的权重,取值范围α>0。 i=1,2时分别执行约束条件。
低秩稀疏张量分解模型求解:求解方式即按照技术方案中的算法来求。
非常态出行模式可视化分析:对非常态张量模型做Tucker分解后的基底矩阵分别做可视化,分解后核张量维度设置为6*4*3。即六种空间模式、四种功能区模式、三种时间模式,在此以起点为例分析。
功能区模式:在研究区域内将功能区划分为11类:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学。几种非常态模式下各功能区乘客比例如图2所示,在几种模式中都出现了大学,这说明大学周围非常态出行较多,这可能是由于大学的开放性和受大学生出门不固定性等因素影响。大部分模式中都出现了居民区,而且出现时占比较大,居民区存在较多非常态出行可能受非通勤人群影响,他们不会在规律的时间段出行。模式一种几乎出现了所有功能区,产生这种现象的原因可能是受某个时间段影响较大,例如晚上,居民时间比较自由,随机性强。
空间模式:对六种空间模式(位置信息)可视化在结果中用三角形标记为火车站和汽车站,圆形标记为两所大学,箭头标记为较为集中办公区,星标为集中商业区。模式一和模式四非常态模式出现的位置相似,包含了较多的商业区、景区和大学的位置,这表明在景区附近每天乘客需求量却很难固定,而大学由于其开放性和学生时间比较自由也会造成这种非常态模式出现。模式二中较多区域较多区域出现非常态模式,这对应了功能区模式一出现的情况,可能在某个时间段内居民出行不受约束,出现很强随机性。在模式三和模式五包含了很多住宅区,由于非通勤人员出行随机性,很难确定什么时间段会出门所以在一些功能区也会出现非常态模式,这种模式和时间模式二相对应。
时间模式:对于时间在此分出三种异常模式如图3所示,其中模式一(圆形)主要出现在下午和晚上时间段,而模式二(三角形)主要出现在白天几乎每隔三个小时出现一次。认为这两种模式主要为非通勤人群和学生主导,与出现在居民区和大学的数据相关联,由于其白天各时间段都有出行数据,模式二更可能与居民区有关。而模式三(方形)主要出现在上午而后面时间段几乎不再出现,这种模式的出现可能与某些公司错峰上班有关。
综上分析,本发明提出的居民非常态出行模式分析方法优于传统的方法,它不仅挖掘了时间空间两个维度的出行模式规律,还挖掘了不同功能区的乘客出行模式以及与之对应的出行驱动因素。从方法上,使用张量表示数据更直观的表示了出租车OD数据各个维度之间的联系,Tucker分解得到的基底矩阵可以更好的反应各模式下的出行规律,不同模式的可视化也可以更直观地展示非常态模式和其相关性,同时计算速度也优于传统方法。通过对非常态出行模式的挖掘,可以相应的对出租车进行调度,不仅避免出现乘客堆积的状况,还能相应的提高出租车利用率以及出租车运营效益。
Claims (1)
1.基于出租车OD数据的非常态居民出行模式挖掘方法,其特征在于:
1)数据预处理和功能区划分:原始数据是使用嘀嘀打车数据,原始数据记录乘客从上车开始到下车的行车轨迹,在此提取每条数据的起点和终点O-D数据的时间和经纬度信息;研究区域总共包括8km*8km的正方形区域,对此区域各位置做功能区属性划分,对不同区域用使用不同颜色不透明像素将其覆盖;总共分类为11中功能区类别包括:住宅区、中小学、工厂、商业区、景区、办公区、医院、酒店、体育馆、车站、大学;
2)构建数据张量:把出租车O-D数据中的时间位置信息以及根据功能区划分中得到的功能区属性结合起来构成三维数据张量;在张量中坐标位置为(v,f,t)的数据表示的含义为乘客在t时刻属性为f的v点打车所产生的数据;三阶张量中每个单位格子中表示某时间段内某个位置的某个区域的打车数据量;
3)低秩稀疏张量分解模型构建:为了得到数据中非常态模式的数据,在此对原始张量做一个提取分解,使得原始张量分解为一个低秩的常态模式张量和一个稀疏的非常态模式张量;常态模式即为每天交通规律中周期性较强的数据,在每个时间段每个地点出现的打车数量相似;而非常态模式则为在周期性之外的数据,这样的数据通常出现的频率较低;为经过预处理后的OD数据和功能区数据张量,三个矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3;通过如下的低秩稀疏张量分解模型,构建表达常态模式张量D1与非常态模式张量D2以及相应的不同维度模态,即
目标函数第一项||[D1](3)||*表示对常态模式下张量的时间维度做低秩约束,|| ||*表示核范数约束,||D2||1表示对D2做稀疏约束,×1,×2,×3表示模乘,Vi,Fi,Ti分别为张量Di不同维度的基底,Ai,i=1,2为对应基底下的核张量,即表示系数,矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为17×3,0.1≤α<1为稀疏与低秩约束的权重,从0.1到1寻求最优值,i=1,2时分别执行约束条件;
4)低秩稀疏张量分解模型求解:
为求解(1),在此引入辅助变量Vi′,Fi′,Ti′,i=1,2,辅助变量与V,F,T维度相同,通过初始化随机值赋值来迭代求取最优值,在约束条件中加上约束使辅助变量值逼近原矩阵;把模型(1)改写为
使用乘子法对模型(2)求解,将其转化为如下的增广拉格朗日函数:
其中,<·,·>表示两个矩阵的内积运算,β为对应于约束条件D=D1+D2的拉格朗日乘子,β1,β2分别为Di=Ai×1Vi×2Fi×3Ti的乘子;矩阵V,F,T分别表示位置矩阵,维度为1600×6,区域属性矩阵,维度为11×4和时间的基底矩阵,维度为,17×3;μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;在此采用交替方向法求解(2);具体分为如下几个子问题;
子问题D1求解低秩模型:
其中sign,*,|·|和max均对矩阵逐元素进行运算,其中sign表示元素为正时取1,max表示取最大值;μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;利用奇异值矩阵解得到后对矩阵折叠得到张量D1;
子问题D2求解:
μ为惩罚参数,初始值为1,在每次迭代中以1.05倍速度增大;解得D2;
子问题Vi,i=1,2求解位置基底矩阵,维度为1600×6:
对张量取模一展开将式(8)转化为:
Vi=PQT (11)
其中P,Q为svd分解的左右奇异值矩阵;
子问题Fi,i=1,2求解功能区基底矩阵,维度为1600×6:
对张量取模二展开将式(12)转化为:
把(13)的目标函数转化为:
Fi=PQT (15)
其中P,Q为svd分解的左右奇异值矩阵;
子问题Ti,i=1,2求解,时间基底矩阵维度为1600×6:
对张量取模三展开将式(16)变为:
将式(17)的目标函数转化为:
Ti=PQT (19)
其中P,Q为svd分解的左右奇异值矩阵;
子问题Vi′,i=1,2:
子问题Fi′,i=1,2:
子问题Ti′,i=1,2:
最后进行乘子更新及罚参更新;
模型(2)的求解算法见算法1;
算法1:
输出:V1,F1,T1,V2,F2,T2
从k=1开始迭代:
通过(5)计算奇异值矩阵σ1
计算矩阵D1(3)得到张量D1
通过(7)计算张量D2
从i=1到i=2:
分别计算子问题求解Vi,Fi,Ti,Vi′,Fi′,Ti′矩阵
通过(10)(11)计算Vi
通过(14)(15)计算Fi
通过(18)(19)计算Ti
通过(20)计算Vi′
通过(21)计算Fi′
通过(22)计算Ti′
更新乘子βi=βi-μ(Di-Ai×1Vi×2Fi×3Ti)
λ′i=λ′i-μ(Vi-Vi′)
λi″=λ″i-μ(Fi-Fi′)
λ″′i=λ″′i-μ(Ti-Ti')
更新乘子β=β-μ(D-D1-D2)
更新罚参μ=min(μ_max,μ*ρ),μ为惩罚参数,初始值为1,在每次迭代中以ρ倍速度增大,ρ取值为1.05;
结束。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110120448.7A CN112836000A (zh) | 2021-01-28 | 2021-01-28 | 基于出租车od数据的非常态居民出行模式挖掘方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110120448.7A CN112836000A (zh) | 2021-01-28 | 2021-01-28 | 基于出租车od数据的非常态居民出行模式挖掘方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112836000A true CN112836000A (zh) | 2021-05-25 |
Family
ID=75932147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110120448.7A Pending CN112836000A (zh) | 2021-01-28 | 2021-01-28 | 基于出租车od数据的非常态居民出行模式挖掘方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112836000A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227791A (zh) * | 2023-05-08 | 2023-06-06 | 湖南工商大学 | 基于语义融合模型探索城市功能区动态划分的可视分析方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106910017A (zh) * | 2017-02-21 | 2017-06-30 | 深圳供电局有限公司 | 一种基于用户行为数据挖掘的电能体验分析方法和系统 |
CN107992536A (zh) * | 2017-11-23 | 2018-05-04 | 中山大学 | 基于张量分解的城市交通缺失数据填补方法 |
CN109241491A (zh) * | 2018-07-28 | 2019-01-18 | 天津大学 | 基于联合低秩和稀疏表示的张量结构性缺失填充方法 |
-
2021
- 2021-01-28 CN CN202110120448.7A patent/CN112836000A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106910017A (zh) * | 2017-02-21 | 2017-06-30 | 深圳供电局有限公司 | 一种基于用户行为数据挖掘的电能体验分析方法和系统 |
CN107992536A (zh) * | 2017-11-23 | 2018-05-04 | 中山大学 | 基于张量分解的城市交通缺失数据填补方法 |
CN109241491A (zh) * | 2018-07-28 | 2019-01-18 | 天津大学 | 基于联合低秩和稀疏表示的张量结构性缺失填充方法 |
Non-Patent Citations (1)
Title |
---|
刘菊;许;蔡玲;孟斌;裴韬;: "基于出租车用户出行的功能区识别", 地球信息科学学报, no. 11, 28 November 2018 (2018-11-28), pages 14 - 25 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116227791A (zh) * | 2023-05-08 | 2023-06-06 | 湖南工商大学 | 基于语义融合模型探索城市功能区动态划分的可视分析方法 |
CN116227791B (zh) * | 2023-05-08 | 2023-09-05 | 湖南工商大学 | 基于语义融合模型探索城市功能区动态划分的可视分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Contextualized spatial–temporal network for taxi origin-destination demand prediction | |
Chen et al. | Predicting station level demand in a bike‐sharing system using recurrent neural networks | |
Li et al. | A hierarchical temporal attention-based LSTM encoder-decoder model for individual mobility prediction | |
Hua et al. | Estimating the parking demand of free-floating bike sharing: A journey-data-based study of Nanjing, China | |
CN110414747B (zh) | 一种基于深度学习的时空长短期城市人流量预测方法 | |
Du et al. | Spatiotemporal exploration of the non-linear impacts of accessibility on metro ridership | |
Kohan et al. | Discovering traffic congestion through traffic flow patterns generated by moving object trajectories | |
CN110837973B (zh) | 一种基于交通出行数据的人类出行选择信息挖掘方法 | |
CN111160622A (zh) | 基于混合神经网络模型的景区客流预测方法和装置 | |
Zhao et al. | Coupling graph deep learning and spatial-temporal influence of built environment for short-term bus travel demand prediction | |
Tian et al. | Dynamic evolution of demand fluctuation in bike-sharing systems for green travel | |
Pang et al. | Development of people mass movement simulation framework based on reinforcement learning | |
Cheng et al. | Developing a travel time estimation method of freeway based on floating car using random forests | |
Zou et al. | Estimation of travel time based on ensemble method with multi-modality perspective urban big data | |
CN114897444A (zh) | 一种城市分区域内服务设施需求识别方法及系统 | |
Wang et al. | Urban traffic pattern analysis and applications based on spatio-temporal non-negative matrix factorization | |
Saputra et al. | Accessibility model of BRT stop locations using Geographically Weighted regression (GWR): A case study in Banjarmasin, Indonesia | |
Alizadeh et al. | On the role of bridges as anchor points in route choice modeling | |
Ma et al. | Investigating the impact of spatial-temporal grid size on the microscopic forecasting of the inflow and outflow gap in a free-floating bike-sharing system | |
Xu et al. | A taxi dispatch system based on prediction of demand and destination | |
CN112836000A (zh) | 基于出租车od数据的非常态居民出行模式挖掘方法 | |
Zhang et al. | Gof-tte: Generative online federated learning framework for travel time estimation | |
CN112801340A (zh) | 一种基于多层级城市信息单元画像的人群密度预测方法 | |
Corradini et al. | Tangramob: an agent-based simulation framework for validating urban smart mobility solutions | |
Czado et al. | Modelling transport mode decisions using hierarchical logistic regression models with spatial and cluster effects |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |