CN113709660B - 一种运用手机信令数据的出行路径精确提取方法 - Google Patents

一种运用手机信令数据的出行路径精确提取方法 Download PDF

Info

Publication number
CN113709660B
CN113709660B CN202110869051.8A CN202110869051A CN113709660B CN 113709660 B CN113709660 B CN 113709660B CN 202110869051 A CN202110869051 A CN 202110869051A CN 113709660 B CN113709660 B CN 113709660B
Authority
CN
China
Prior art keywords
travel
point
time
mobile phone
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110869051.8A
Other languages
English (en)
Other versions
CN113709660A (zh
Inventor
蔡先华
孙赫杨
张远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202110869051.8A priority Critical patent/CN113709660B/zh
Publication of CN113709660A publication Critical patent/CN113709660A/zh
Application granted granted Critical
Publication of CN113709660B publication Critical patent/CN113709660B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明提出一种运用手机信令数据的出行路径精确提取方法,该方法包括:基于时空信息的层次聚类法提取出行起讫点(OD);基于多模式综合交通网络和时空信息的出行链分段路径提取;路径融合提取单日出行路径。本申请运用于手机信令数据的数据挖掘,通过基于时空信息的层次聚类法提取出用户单日的多段出行,根据每段出行间的轨迹点数据空间形态和时间信息,基于多模式综合交通网络,提取出每段出行对应的出行路径,再将多段单次出行路径连接起来,获取每日的出行路径。基于时空数据挖掘技术,通过聚类分析,减小了手机信令数据提取出行路径的误差;考虑手机信令数据的时间序列和空间形态信息,实现对城市手机用户出行路径的快速、精确提取。

Description

一种运用手机信令数据的出行路径精确提取方法
技术领域
本发明属于大数据挖掘技术领域,特别是涉及一种手机信令数据的出行路径精确提取方法。
背景技术
当前移动通信网络实现了城乡空间区域的全覆盖,城乡人口中的手机用户已经达到相当高的比例,广大的手机用户群体为交通信息的采集提供了持续可靠的数据源。通过基站对移动终端的定位,研究者能够获取可以反映移动终端当前时间、位置等信息的手机信令数据,进而从中获取移动终端使用者的出行轨迹等信息。手机用户的手机信令数据具有实时性强、覆盖范围广、获取方便的特点。手机信令数据作为个人活动数据的记录,包含大量丰富的信息,如活动的位置、时间、热点区域分布和常驻地点,这为从手机信令数据中挖掘用户的出行路径提供了基础。
大数据分析是用特定的方法对大数据进行挖掘以获得深入的、有价值的信息的技术。手机信令数据作为大数据的一种,通过对手机信令数据的分析可获取空间对象的驻留点、移动轨迹等具有广泛应用价值信息。聚类是一种对数据进行处理以获取相关信息的方法,它根据数据之间的某种相似性将数据划分为不同的组或簇,使得在同一簇内的数据相似性尽可能大,不在同一簇内的数据差异性也尽可能的大。
本发明提出一种运用手机信令数据的出行路径精确提取方法,从聚类的角度对手机信令数据进行挖掘,分析个人在单日内出行的停留情况,基于停留情况确定出行链分段,对单一目的下的出行链分段进行出行路径提取。对城市居民的出行调查研究具有重要的实用价值,也为手机信令数据的挖掘提供了新的途经。
发明内容
技术问题:本发明提出一种运用手机信令数据的出行路径精确提取方法。运用该方法,可以对手机信令数据进行聚类分析获取停留点,提取单一出行目的出行链分段,根据出行链分段的时空属性,基于多模式综合交通网络,运用路径因子选择模型和K-Shortest算法,提取出行链分段对应的出行路径候选集,最后根据手机信令数据的时空属性,采用时空Fréchet距离,匹配相似度,提取出行链分段的匹配路径,根据时路径序特征,即可确定用户单日的出行路径。
技术方案:本发明提出一种运用手机信令数据的出行路径的精确提取方法,该方法包括如下步骤:
步骤一:基于动态时空阈值的层次聚类算法:根据手机信令数据的时间序列关系和空间位置关系,对手机信令数据轨迹点聚类,动态更新轨迹点之间的时空距离尺度,将一天内的完整出行轨迹划分为多段单一出行方式下的出行,后称“单一出行”,每段单一出行由起讫点(Orion-Destination Point,OD Point)和起讫点(OD)间轨迹点构成;
步骤二:出行OD与多模式综合交通网络匹配:构建包含道路中心线网络Gaxis、公交网络Gbus,地铁网络Gs在内的多模式综合交通网络GR,在GR中采用距离最近原则将OD点对匹配到网络上;
步骤三:完整出行轨迹中单一出行的出行方式初步判别:调用地图API从时间和空间角度联合判别单一出行的出行方式;
步骤四:轨迹候选集提取,根据多模式综合网络,将出行方式划分为:步行、骑行、驾车、公交、地铁,步行、骑行、驾车分配在道路中心线网络Gaxis,公交、地铁分配在公交网络Gbus,地铁网络Gs。对于已判别了出行方式的单一出行,直接在对应的网络中,提取出行轨迹候选集,对于未判别出行方式的出行,则在不同的网络中,同时提取不同出行方式下的出行轨迹候选集;
步骤五:出行轨迹确定:根据步骤三的出行方式初步判别和步骤四的轨迹候选集提取确定候选集中与手机信令数据轨迹点列时空相似度最大的轨迹为出行轨迹,综合两种曲线相似度算法,选择出行轨迹候选集中与手机信令数据轨迹点列时空形态最相似的轨迹。
本发明对距离模型进一步改进,首先定义完整出行轨迹对应的出行链:
Figure GDA0003634193210000021
出行链由两个属性构成:轨迹Trajectory和出行方式TravelMode。每天的出行链在时间上连续地构成闭环,在空间上呈现为以停留点为起讫点(OD)的多段单一出行,每段单一出行都是基于一定目的的活动。
步骤一中手机信令数据轨迹点p(x1,y1,t1),q(x1,y1,t1)间的时空距离尺度模型定义为;
Figure GDA0003634193210000022
即点p与点q之间的欧式距离和时间差的绝对值,其中,点p、q为手机信令数据构成的任意两个轨迹点,(x1,y1)为点p的空间坐标,t1为点p在位置(x1,y1)的时间戳,(x2,y2)为点q的空间坐标,t2为点q在位置(x2,y2)的时间戳。
作为本发明的进一步改进,定义手机信令数据轨迹点数据集:
Figure GDA0003634193210000031
式中,
Figure GDA0003634193210000032
表示第i个用户的手机信令数据轨迹点序列中的第n个点。在实际的出行中,手机信令数据轨迹点序列可用出行链对应的多段单一出行OD对表征:
Figure GDA0003634193210000033
式中,ODi表示第i段单一出行,包含起讫点和起讫点之间手机信令数据轨迹点单一出行的OD有如下特征:
ODi={pk,pk+1,...,pk+m},1≤k≤n∩k+m<n
式中,pk代表手机信令数据轨迹点,式中,pk代表手机信令数据轨迹点,k表示第i段单一出行自第i用户第k个手机信令数据轨迹点起得轨迹点时间序列值,n表示该日该用户所有手机信令数据轨迹点数量,m表示第i段单一出行中手机信令数据轨迹点数量。
作为本发明的进一步改进,步骤一中基于动态时空阈值的层次聚类算法,计算轨迹点之间的距离,将时空距离最近的点合并到同一个类,该方法中,动态标定停留距离阈值Dn和停留时间阈值Tn,Dn的含义为停留距离阈值,用以判断的轨迹点在空间上是否属于同一次停留。Tn含义为停留时间阈值,是停留距离阈值在时间纬度的拓展,用以判断窗口内的轨迹点在时间顺序上是否属于同一停留。其含义为:用户在Tn时间内运动范围不超过Dn,即可考虑为一次停留,tj-tj+m表示j点和j+m点的时间差,dist(pj,pj+m)表示j点和j+m点的空间距离。
Figure GDA0003634193210000034
所述方法步骤如下:
(1)以单个用户为处理单元,选取单日内所有手机信令数据轨迹点,按照时间顺序排列;
(2)创建空滑动窗口W1,W2,按照时间顺序遍历手机信令数据点,逐个加入窗口W1;
(3)每加入一个点,更新窗口的中心点,判断窗口内所有点到中心点的距离是否小于停留距离阈值Dn;
(4)若小于Dn,则按照时间顺序向窗口内继续添加下一个手机信令数据点;
(5)若大于Dn,则判断窗口内所有点的起始时间和终止时间之差是否大于停留时间阈值Tn,若大于,则窗口内所有点数据属于停留点;
(6)每出现一个出行点,将该出行点时间序列上之前的最后一个停留点和出行点同时加入W2,W1同时添加新的手机信令数据轨迹点,设置放大检测标记Flag=0,在W2中计算三点构成的角度Ang,若Ang>90°,该出行点为真实出行,清空W2,继续向W1中添加点;若Ang≤90°,则该出行点可能非真实出行,清空W2,将W1退回至该出行点前一个点,放大停留距离阈值Dn=2Dn,Flag自增1,回到步骤(2);
(7)在步骤(6)中,多个点的停留状态被重新判别后,若判断为停留,缩放停留距离阈值,若判断非停留,将Dn设置为初始值,该点确认为出行点,若Flag>2,则清空窗口W2,W1推进至下一点,将Dn设置为初始值。
作为本发明进一步改进,步骤二中出行OD与多模式综合交通网络匹配的方法,其步骤如下:
(1)初始化,构造包含行车道、自行车道和人行道的道路网络、地面公共交通网络、地铁网络在内的多模式综合交通网络GR
(2)匹配OD点,遍历由聚类算法获取的OD点对,在GR中采用距离最近原则将OD点对匹配到网络上,分别有如下两类情况:
1.道路中心线路网:该网络上的出行方式可能是步行、非机动车、非公共交通机动车,待匹配OD点的分配节点为其最近邻道路弧段上的投影点。如附图2所示,若投影点是网络节点,则直接将待匹配OD点匹配到节点上;若投影点非网络节点,则将OD点投影到弧段上,分割弧段并打散原始网络拓扑结构,将投影点作为新网络节点Vnew加入,动态更新网络的拓扑结构,重新修复网络,Vnew为起讫点在道路中心线网络中轨迹求解的起讫网络节点。
2.公交网络Gbus和地铁网络Gs:待匹配OD点之间的出行方式是公交或地铁,因此OD点的匹配位置为其最邻近的公交站、地铁站。以待匹配OD点为圆心,建立半径为Dn的缓冲区,搜索缓冲区内的所有公交站、地铁站,在这些站点中取与待匹配OD点欧式距离最小者,即为起讫点在Gbus、Gs中轨迹求解的起讫网络节点。
作为本发明进一步改进,步骤三中初步判定单一出行方式的方法,其步骤如下:
初步判断出行方式,从时间和空间角度联合判别出行方式。在时间维度中,提取OD点对的时间差,调用地图API,计算OD点对在不同出行方式下的最优路径耗时,选取与OD点对间时间差最相似的作为时间维度备选出行方式。在空间维度中,在多模式综合交通网络求解最优路径,选取与OD点对时空相似度最大的出行方式作为空间维备选出行方式。若时空维度下的两种备选出行方式一致,则以该出行方式为本段出行的出行方式,若时空维度下的两种备选出行方式不一致,则不以该出行方式为本段出行的出行方式。
作为本发明进一步改进,步骤四中轨迹候选集提取的方法,其步骤如下:
轨迹候选集提取,对于时空维度下两种备选出行方式一致的出行,直接在对应的网络中,提取出行轨迹候选集,对于时空维度下两种备选出行方式不一致的出行,则在不同的网络中,同时提取不同出行方式下的出行轨迹候选集。在出行轨迹候选集的提取中,采用不同的算法:在Gaxis中,利用堆优化的K-Shortest算法求解VO、VD之间的前k条最短轨迹;在Gbus、Gs中,利用公共交通换乘算法求解VO、VD之间的无换乘、一次换乘、二次换乘轨迹。这些轨迹构成可能的轨迹候选集Setcps
作为本发明进一步改进,步骤五中出行轨迹确定的方法,其步骤如下:
确定候选集中与手机信令数据轨迹点列时空相似度最大的轨迹为出行轨迹,综合两种曲线相似度算法,选择出行轨迹候选集中与手机信令数据轨迹点列时空形态最相似的轨迹,有如下公式:
Path=Fun(SeqMPD,Setcps) (3-6)
式中,Path是每段出行的OD点对之间计算所得出行轨迹,Fun函数是曲线时空相似度计算函数,SeqMPD是OD点对及之间的手机信令数据轨迹点列,Setcps是步骤四获取的OD点对间出行轨迹候选集,通过Fun函数,计算候选集中所有轨迹和SeqMPD的曲线时空相似度,返回相似度最大的一条确定为真实出行轨迹。
步骤五中,Fun函数含义为采用Fréchet距离和离差平方和距离的组合度量曲线之间的时空相似度。
有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果:
(1)区分度高:本方法考虑了数据点间的时间序列信息,在聚类和路径提取时相似度判断更加严格,得到的OD点和出行路径之间区分度更高。
(2)准确度高:本方法在出行路径提取时,将单日的出行链划分为多段单一目的出行链分段,在排除了传统方法中多种出行方式混杂的干扰。此外路径与路径之间不仅需要在空间上具有相似性,还需要在时间上具有相似性,得到的出行路径准确度更高,误差更小。
附图说明
图1为手机信令数据聚类与出行链分段示意图;
图2为多模式综合交通网络上的OD匹配示意图;
图3为原始手机信令数据聚类图;图3(a)出行状态分类图,图3中,(b)聚类结果示意图;
图4为提取的真实路径、路径候选集、匹配所得路径对比图;图4中,(a)真实出行轨迹示意图,(b)本专利提取的出行路径示意图;
图5为20条随机路径的匹配得分。
具体实施方式
下面结合附图与具体实施方式对本发明作进一步详细描述:
本发明提出一种运用手机信令数据的出行路径的精确提取方法,该方法包括如下步骤:
步骤一:基于动态时空阈值的层次聚类算法:根据手机信令数据的时间序列关系和空间位置关系,对手机信令数据轨迹点聚类,动态更新轨迹点之间的时空距离尺度,将一天内的完整出行轨迹划分为多段单一出行方式下的出行,后称单一出行,每段单一出行由起讫点(Orion-Destination Point,OD Point)和起讫点(OD)间轨迹点构成;
首先定义完整出行轨迹对应的出行链:
Figure GDA0003634193210000061
出行链由两个属性构成:轨迹Trajectory和出行方式TravelMode。每天的出行链在时间上连续地构成闭环,在空间上呈现为以停留点为起讫点(OD)的多段单一出行,每段单一出行都是基于一定目的的活动。
步骤一中手机信令数据轨迹点p(x1,y1,t1),q(x1,y1,t1)间的时空距离尺度模型定义为;
Figure GDA0003634193210000071
即点p与点q之间的欧式距离和时间差的绝对值,其中,点p、q为手机信令数据构成的任意两个轨迹点,(x1,y1)为点p的空间坐标,t1为点p在位置(x1,y1)的时间戳,(x2,y2)为点q的空间坐标,t2为点q在位置(x2,y2)的时间戳。
定义手机信令数据轨迹点数据集:
Figure GDA0003634193210000072
式中,
Figure GDA0003634193210000073
表示第i个用户的手机信令数据轨迹点序列中的第n个点。在实际的出行中,手机信令数据轨迹点序列可用出行链对应的多段单一出行OD对表征:
Figure GDA0003634193210000074
式中,ODi表示第i段单一出行,包含起讫点和起讫点之间手机信令数据轨迹点单一出行的OD有如下特征:
ODi={pk,pk+1,...,pk+m},1≤k≤n∩k+m<n
式中,pk代表手机信令数据轨迹点,式中,pk代表手机信令数据轨迹点,k表示第i段单一出行自第i用户第k个手机信令数据轨迹点起得轨迹点时间序列值,n表示该日该用户所有手机信令数据轨迹点数量,m表示第i段单一出行中手机信令数据轨迹点数量。
步骤一中基于动态时空阈值的层次聚类算法,计算轨迹点之间的距离,将时空距离最近的点合并到同一个类,该方法中,动态标定停留距离阈值Dn和停留时间阈值Tn,Dn的含义为停留距离阈值,用以判断的轨迹点在空间上是否属于同一次停留。Tn含义为停留时间阈值,是停留距离阈值在时间纬度的拓展,用以判断窗口内的轨迹点在时间顺序上是否属于同一停留。其含义为:用户在Tn时间内运动范围不超过Dn,即可考虑为一次停留,tj-tj+m表示j点和j+m点的时间差,dist(pj,pj+m)表示j点和j+m点的空间距离。
Figure GDA0003634193210000081
所述方法步骤如下:
(1)以单个用户为处理单元,选取单日内所有手机信令数据轨迹点,按照时间顺序排列;
(2)创建空滑动窗口W1,W2,按照时间顺序遍历手机信令数据点,逐个加入窗口W1;
(3)每加入一个点,更新窗口的中心点,判断窗口内所有点到中心点的距离是否小于停留距离阈值Dn;
(4)若小于Dn,则按照时间顺序向窗口内继续添加下一个手机信令数据点;
(5)若大于Dn,则判断窗口内所有点的起始时间和终止时间之差是否大于停留时间阈值Tn,若大于,则窗口内所有点数据属于停留点;
(6)每出现一个出行点,将该出行点时间序列上之前的最后一个停留点和出行点同时加入W2,W1同时添加新的手机信令数据轨迹点,设置放大检测标记Flag=0,在W2中计算三点构成的角度Ang,若Ang>90°,该出行点为真实出行,清空W2,继续向W1中添加点;若Ang≤90°,则该出行点可能非真实出行,清空W2,将W1退回至该出行点前一个点,放大停留距离阈值Dn=2Dn,Flag自增1,回到步骤(2);
(7)在步骤(6)中,多个点的停留状态被重新判别后,若判断为停留,缩放停留距离阈值,若判断非停留,将Dn设置为初始值,该点确认为出行点,若Flag>2,则清空窗口W2,W1推进至下一点,将Dn设置为初始值。
步骤二:出行OD与多模式综合交通网络匹配:构建包含道路中心线网络Gaxis、公交网络Gbus,地铁网络Gs在内的多模式综合交通网络GR,在GR中采用距离最近原则将OD点对匹配到网络上;
步骤二中出行OD与多模式综合交通网络匹配的方法,其步骤如下:
(1)初始化,构造包含行车道、自行车道和人行道的道路网络、地面公共交通网络、地铁网络在内的多模式综合交通网络GR
(2)匹配OD点,遍历由聚类算法获取的OD点对,在GR中采用距离最近原则将OD点对匹配到网络上,分别有如下两类情况:
1.道路中心线路网:该网络上的出行方式可能是步行、非机动车、非公共交通机动车,待匹配OD点的分配节点为其最近邻道路弧段上的投影点。如附图2所示,若投影点是网络节点,则直接将待匹配OD点匹配到节点上;若投影点非网络节点,则将OD点投影到弧段上,分割弧段并打散原始网络拓扑结构,将投影点作为新网络节点Vnew加入,动态更新网络的拓扑结构,重新修复网络,Vnew为起讫点在道路中心线网络中轨迹求解的起讫网络节点。
2.公交网络Gbus和地铁网络Gs:待匹配OD点之间的出行方式是公交或地铁,因此OD点的匹配位置为其最邻近的公交站、地铁站。以待匹配OD点为圆心,建立半径为Dn的缓冲区,搜索缓冲区内的所有公交站、地铁站,在这些站点中取与待匹配OD点欧式距离最小者,即为起讫点在Gbus、Gs中轨迹求解的起讫网络节点。
步骤三:完整出行轨迹中单一出行的出行方式初步判别:调用地图API从时间和空间角度联合判别单一出行的出行方式;步骤三中初步判定单一出行方式的方法,其步骤如下:
初步判断出行方式,从时间和空间角度联合判别出行方式。在时间维度中,提取OD点对的时间差,调用地图API,计算OD点对在不同出行方式下的最优路径耗时,选取与OD点对间时间差最相似的作为时间维度备选出行方式。在空间维度中,在多模式综合交通网络求解最优路径,选取与OD点对时空相似度最大的出行方式作为空间维备选出行方式。若时空维度下的两种备选出行方式一致,则以该出行方式为本段出行的出行方式,若时空维度下的两种备选出行方式不一致,则不以该出行方式为本段出行的出行方式。
步骤四:轨迹候选集提取,根据多模式综合网络,将出行方式划分为:步行、骑行、驾车、公交、地铁,步行、骑行、驾车分配在道路中心线网络Gaxis,公交、地铁分配在公交网络Gbus,地铁网络Gs。对于已判别了出行方式的单一出行,直接在对应的网络中,提取出行轨迹候选集,对于未判别出行方式的出行,则在不同的网络中,同时提取不同出行方式下的出行轨迹候选集;
步骤四中轨迹候选集提取的方法,其步骤如下:
轨迹候选集提取,对于时空维度下两种备选出行方式一致的出行,直接在对应的网络中,提取出行轨迹候选集,对于时空维度下两种备选出行方式不一致的出行,则在不同的网络中,同时提取不同出行方式下的出行轨迹候选集。在出行轨迹候选集的提取中,采用不同的算法:在Gaxis中,利用堆优化的K-Shortest算法求解VO、VD之间的前k条最短轨迹;在Gbus、Gs中,利用公共交通换乘算法求解VO、VD之间的无换乘、一次换乘、二次换乘轨迹。这些轨迹构成可能的轨迹候选集Setcps
步骤五:出行轨迹确定:根据步骤三的出行方式初步判别和步骤四的轨迹候选集提取确定候选集中与手机信令数据轨迹点列时空相似度最大的轨迹为出行轨迹,综合两种曲线相似度算法,选择出行轨迹候选集中与手机信令数据轨迹点列时空形态最相似的轨迹。
步骤五中出行轨迹确定的方法,其步骤如下:
确定候选集中与手机信令数据轨迹点列时空相似度最大的轨迹为出行轨迹,综合两种曲线相似度算法,选择出行轨迹候选集中与手机信令数据轨迹点列时空形态最相似的轨迹,有如下公式:
Path=Fun(SeqMPD,Setcps) (3-6)
式中,Path是每段出行的OD点对之间计算所得出行轨迹,Fun函数是曲线时空相似度计算函数,SeqMPD是OD点对及之间的手机信令数据轨迹点列,Setcps是步骤四获取的OD点对间出行轨迹候选集,通过Fun函数,计算候选集中所有轨迹和SeqMPD的曲线时空相似度,返回相似度最大的一条确定为真实出行轨迹。
步骤五中,Fun函数含义为采用Fréchet距离和离差平方和距离的组合度量曲线之间的时空相似度。
下面结合附图,通过实例对本发明进行详细说明,但本发明的保护范围不局限于所述实施例。
实施例
(1)准备数据:原始手机信令数据是带有时间序列信息的轨迹点数据(附图1),从图中可以看出,轨迹点存在明显的空间聚集特征,呈现出在停留时以类圆形聚集,在出行时以线状点列分布的空间形态,具有典型的部分聚集特征和分段出行特征。
(2)通过聚类提取单一出行OD:对用户单日的数据进行处理,将这一天的手机信令数据轨迹点分为多段单一出行,提取每一段单一出行的OD。得到的出行OD图(如附图3)。
(3)提取单一出行候选路径集:根据聚类提取所得OD,将OD点匹配在多模式综合交通网络中,应用时空维度联合判别的方式,初步判别出行方式,进而应用改进的K-Shortest算法和公交换乘算法分别提取不同出行方式下的k优出行路径,作为该OD对应的出行路径候选集,如附图4中(b)所示。
(4)提取出行路径:在候选集中,应用时间维度扩展的Fréchet距离算法和离差平方和距离算法,计算时空维度下与手机信令数据轨迹点序列最为相似的出行路径,得精确出行路径。依据真实路径,计算路径匹配准确度,随机选取20条出行路径与真实路径计算匹配准确度,如图5所示。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。

Claims (5)

1.一种运用手机信令数据的出行路径的精确提取方法,其特征在于,该方法包括如下步骤:
步骤一:基于动态时空阈值的层次聚类算法:根据手机信令数据的时间序列关系和空间位置关系,对手机信令数据轨迹点聚类,动态更新轨迹点之间的时空距离尺度,将一天内的完整出行轨迹划分为多段单一出行方式下的出行,后称单一出行,每段单一出行由起讫点(Orion-Destination Point,OD Point)和起讫点(OD)间轨迹点构成;
步骤二:出行起讫点(OD)与多模式综合交通网络匹配:构建包含道路中心线网络Gaxis、公交网络Gbus,地铁网络Gs在内的多模式综合交通网络GR,在GR中采用距离最近原则将起讫点(OD)点对匹配到网络上;
步骤三:完整出行轨迹中单一出行的出行方式初步判别:调用地图API从时间和空间角度联合判别单一出行的出行方式;
步骤四:轨迹候选集提取,根据多模式综合网络,将出行方式划分为:步行、骑行、驾车、公交、地铁;步行、骑行、驾车分配在道路中心线网络Gaxis,公交、地铁分配在公交网络Gbus,地铁网络Gs,对于已判别了出行方式的单一出行,直接在对应的网络中,提取出行轨迹候选集,对于未判别出行方式的出行,则在不同的网络中,同时提取不同出行方式下的出行轨迹候选集;
步骤五:出行轨迹确定:根据步骤三的出行方式初步判别和步骤四的轨迹候选集提取确定候选集中与手机信令数据轨迹点列时空相似度最大的轨迹为出行轨迹,综合两种曲线相似度算法,选择出行轨迹候选集中与手机信令数据轨迹点列时空形态最相似的轨迹;
步骤一的具体方法如下:定义完整出行轨迹对应的出行链:
Figure FDA0003634193200000011
出行链由两个属性构成:轨迹Trajectory和出行方式TravelMode,每天的出行链在时间上连续地构成闭环,在空间上呈现为以停留点为起讫点(OD)的多段单一出行,每段单一出行都是基于一定目的的活动;
步骤一中手机信令数据轨迹点p(x1,y1,t1),q(x1,y1,t1)间的时空距离尺度模型定义为;
Figure FDA0003634193200000012
即点p与点q之间的欧式距离和时间差的绝对值,其中,点p、q为手机信令数据构成的任意两个轨迹点,(x1,y1)为点p的空间坐标,t1为点p在位置(x1,y1)的时间戳,(x2,y2)为点q的空间坐标,t2为点q在位置(x2,y2)的时间戳;
定义手机信令数据轨迹点数据集:
Figure FDA0003634193200000021
式中,
Figure FDA0003634193200000022
表示第i个用户的手机信令数据轨迹点序列中的第n个点,在实际的出行中,手机信令数据轨迹点序列用出行链对应的多段单一出行起讫点(OD)对表征:
Figure FDA0003634193200000023
式中,ODi表示第i段单一出行,包含起讫点和起讫点之间手机信令数据轨迹点单一出行的OD有如下特征:
ODi={pk,pk+1,...,pk+m},1≤k≤n∩k+m<n
式中,pk代表手机信令数据轨迹点,k表示第i段单一出行自第i用户第k个手机信令数据轨迹点起得轨迹点时间序列值,n表示该日该用户所有手机信令数据轨迹点数量,m表示第i段单一出行中手机信令数据轨迹点数量;
步骤一中基于动态时空阈值的层次聚类算法,计算轨迹点之间的距离,将时空距离最近的点合并到同一个类,该方法中,动态标定停留距离阈值Dn和停留时间阈值Tn,Dn的含义为停留距离阈值,用以判断的轨迹点在空间上是否属于同一次停留,Tn含义为停留时间阈值,是停留距离阈值在时间纬度的拓展,用以判断窗口内的轨迹点在时间顺序上是否属于同一停留,其含义为:用户在Tn时间内运动范围不超过Dn,即考虑为一次停留,tj-tj+m表示j点和j+m点的时间差,dist(pj,pj+m)表示j点和j+m点的空间距离;
Figure FDA0003634193200000024
步骤一中聚类算法步骤如下:
(1)以单个用户为处理单元,选取单日内所有手机信令数据轨迹点,按照时间顺序排列;
(2)创建空滑动窗口W1,W2,按照时间顺序遍历手机信令数据点,逐个加入窗口W1;
(3)每加入一个点,更新窗口的中心点,判断窗口内所有点到中心点的距离是否小于停留距离阈值Dn;
(4)若小于Dn,则按照时间顺序向窗口内继续添加下一个手机信令数据点;
(5)若大于Dn,则判断窗口内所有点的起始时间和终止时间之差是否大于停留时间阈值Tn,若大于,则窗口内所有点数据属于停留点;
(6)每出现一个出行点,将该出行点时间序列上之前的最后一个停留点和出行点同时加入W2,W1同时添加新的手机信令数据轨迹点,设置放大检测标记Flag=0,在W2中计算三点构成的角度Ang,若Ang>90°,该出行点为真实出行,清空W2,继续向W1中添加点;若Ang≤90°,则该出行点可能非真实出行,清空W2,将W1退回至该出行点前一个点,放大停留距离阈值Dn=2Dn,Flag自增1,回到步骤(2);
(7)在步骤(6)中,多个点的停留状态被重新判别后,若判断为停留,缩放停留距离阈值,若判断非停留,将Dn设置为初始值,该点确认为出行点,若Flag>2,则清空窗口W2,W1推进至下一点,将Dn设置为初始值。
2.根据权利要求1所述的一种运用手机信令数据的出行路径的精确提取方法,其特征在于,步骤二中出行起讫点(OD)与多模式综合交通网络匹配的方法,其步骤如下:
(1)初始化,构造包含行车道、自行车道和人行道的道路网络、地面公共交通网络、地铁网络在内的多模式综合交通网络GR
(2)匹配起讫点(OD)点,遍历由聚类算法获取的起讫点(OD)点对,在GR中采用距离最近原则将OD点对匹配到网络上,分别有如下两类情况:
道路中心线路网:该网络上的出行方式可能是步行、非机动车、非公共交通机动车,待匹配起讫点(OD)点的分配节点为其最近邻道路弧段上的投影点;若投影点是网络节点,则直接将待匹配起讫点(OD)匹配到节点上;若投影点非网络节点,则将起讫点(OD)投影到弧段上,分割弧段并打散原始网络拓扑结构,将投影点作为新网络节点Vnew加入,动态更新网络的拓扑结构,重新修复网络,Vnew为起讫点在道路中心线网络中轨迹求解的起讫网络节点;
公交网络Gbus和地铁网络Gs:待匹配起讫点(OD)之间的出行方式是公交或地铁,因此起讫点(OD)的匹配位置为其最邻近的公交站、地铁站,以待匹配起讫点(OD)为圆心,建立半径为Dn的缓冲区,搜索缓冲区内的所有公交站、地铁站,在这些站点中取与待匹配起讫点(OD)欧式距离最小者,即为起讫点在Gbus、Gs中轨迹求解的起讫网络节点。
3.根据权利要求2所述的一种运用手机信令数据的出行路径的精确提取方法,其特征在于,步骤三中,初步判定单一出行方式的方法,其步骤如下:初步判断出行方式,从时间和空间角度联合判别出行方式,在时间维度中,提取起讫点(OD)对的时间差,调用地图API,计算起讫点(OD)对在不同出行方式下的最优路径耗时,选取出行时间与起讫点(OD)对间时间差最接近的出行方式作为时间维度备选出行方式;在空间维度中,在多模式综合交通网络求解最优路径,选取与起讫点(OD)对时空相似度最大的出行方式作为空间维度备选出行方式;若时空维度下的两种备选出行方式一致,则以该出行方式为本段出行的出行方式,若时空维度下的两种备选出行方式不一致,则不以该出行方式为本段出行的出行方式。
4.根据权利要求3所述的一种运用手机信令数据的出行路径的精确提取方法,其特征在于,步骤四中,轨迹候选集提取的方法,其步骤如下:轨迹候选集提取,对于时空维度下两种备选出行方式一致的出行,直接在对应的网络中,提取出行轨迹候选集,对于时空维度下两种备选出行方式不一致的出行,则在不同的网络中,同时提取不同出行方式下的出行轨迹候选集,在出行轨迹候选集的提取中,采用不同的算法:在Gaxis中,利用堆优化的K-Shortest算法求解起点VO、讫点VD之间的前k条最短轨迹;在Gbus、Gs中,利用公共交通换乘算法求解VO、VD之间的无换乘、一次换乘、二次换乘轨迹,这些轨迹构成可能的轨迹候选集Setcps
5.根据权利要求4所述的一种运用手机信令数据的出行路径的精确提取方法,其特征在于,步骤五中,出行轨迹确定的方法,其步骤如下:确定候选集中与手机信令数据轨迹点列时空相似度最大的轨迹为出行轨迹,综合两种曲线相似度算法,选择出行轨迹候选集中与手机信令数据轨迹点列时空形态最相似的轨迹,如下公式:
Path=Fun(SeqMPD,Setcps)
式中,Path是每段出行的OD点对之间计算所得出行轨迹,Fun函数是曲线时空相似度计算函数,SeqMPD是起讫点(OD)对及之间的手机信令数据轨迹点列,Setcps是步骤四获取的起讫点(OD)对间出行轨迹候选集,通过Fun函数,计算候选集中所有轨迹和SeqMPD的曲线时空相似度,返回相似度最大的一条确定为真实出行轨迹,Fun函数含义为采用Fréchet距离和离差平方和距离的组合度量曲线之间的时空相似度。
CN202110869051.8A 2021-07-30 2021-07-30 一种运用手机信令数据的出行路径精确提取方法 Active CN113709660B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110869051.8A CN113709660B (zh) 2021-07-30 2021-07-30 一种运用手机信令数据的出行路径精确提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110869051.8A CN113709660B (zh) 2021-07-30 2021-07-30 一种运用手机信令数据的出行路径精确提取方法

Publications (2)

Publication Number Publication Date
CN113709660A CN113709660A (zh) 2021-11-26
CN113709660B true CN113709660B (zh) 2022-06-24

Family

ID=78651174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110869051.8A Active CN113709660B (zh) 2021-07-30 2021-07-30 一种运用手机信令数据的出行路径精确提取方法

Country Status (1)

Country Link
CN (1) CN113709660B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114238792A (zh) * 2021-12-20 2022-03-25 阿波罗智联(北京)科技有限公司 用于轨迹点数据挖掘的方法及装置、电子设备和介质
CN114500743B (zh) * 2022-01-24 2024-07-12 浪潮软件科技有限公司 一种基于时空碰撞算法的信息分析方法
CN115457758B (zh) * 2022-07-08 2024-02-20 北京交通大学 一种移动终端信令数据交通出行方式识别方法
CN115098781B (zh) * 2022-07-11 2024-07-12 西南交通大学 基于出行网络模体的旅客出行特征与出行模式识别方法
CN115587503B (zh) * 2022-11-23 2023-04-07 深圳市城市交通规划设计研究中心股份有限公司 基于多模式仿真的个体出行链还原方法
CN117851809B (zh) * 2024-01-05 2024-06-18 东南大学 一种基于手机信令历史数据强化学习的特征提取方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117789A (zh) * 2015-07-29 2015-12-02 西南交通大学 基于手机信令数据的居民出行方式综合判别的方法
CN109284773A (zh) * 2018-08-15 2019-01-29 西南交通大学 基于多层凝聚层次聚类算法的交通出行端点识别方法
CN110324787A (zh) * 2019-06-06 2019-10-11 东南大学 一种手机信令数据的职住地获取方法
CN111653096A (zh) * 2020-05-29 2020-09-11 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的城市出行方式识别方法
CN112133090A (zh) * 2020-08-14 2020-12-25 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的多方式交通分布模型构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117789A (zh) * 2015-07-29 2015-12-02 西南交通大学 基于手机信令数据的居民出行方式综合判别的方法
CN109284773A (zh) * 2018-08-15 2019-01-29 西南交通大学 基于多层凝聚层次聚类算法的交通出行端点识别方法
CN110324787A (zh) * 2019-06-06 2019-10-11 东南大学 一种手机信令数据的职住地获取方法
CN111653096A (zh) * 2020-05-29 2020-09-11 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的城市出行方式识别方法
CN112133090A (zh) * 2020-08-14 2020-12-25 南京瑞栖智能交通技术产业研究院有限公司 一种基于手机信令数据的多方式交通分布模型构建方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于手机信令和导航数据的出行方式识别方法;杜亚朋,雒江涛,程克非,唐刚,徐正,罗克韧,余疆;《计算机应用研究》;20180831;全文 *

Also Published As

Publication number Publication date
CN113709660A (zh) 2021-11-26

Similar Documents

Publication Publication Date Title
CN113709660B (zh) 一种运用手机信令数据的出行路径精确提取方法
CN102521973B (zh) 一种手机切换定位的道路匹配方法
CN110047277B (zh) 基于信令数据的城市道路交通拥堵排名方法及系统
CN106530716B (zh) 基于手机信令数据计算高速公路路段平均速度的方法
Wang et al. Automatic intersection and traffic rule detection by mining motor-vehicle GPS trajectories
CN108763558B (zh) 一种基于地图匹配的众包地图道路质量改进方法
CN108596202B (zh) 基于移动终端gps定位数据计算个人通勤时间的方法
CN105608505B (zh) 一种基于手机信令数据的居民轨道交通出行方式识别方法
CN106931974B (zh) 基于移动终端gps定位数据记录计算个人通勤距离的方法
CN110909788B (zh) 一种基于统计聚类的轨迹数据中道路交叉口位置识别方法
CN109189949B (zh) 一种人口分布计算方法
CN108961758B (zh) 一种基于梯度提升决策树的路口展宽车道探测方法
CN108320501A (zh) 基于用户手机信令的公交线路识别方法
CN112150796A (zh) 基于手机信令数据的定制公交站点布局方法
CN104866670A (zh) 基于gps时空轨迹的路网拓扑变化自动检测方法及系统
CN113932821B (zh) 基于连续窗口平均方向特征的轨迹地图匹配方法
CN113611115B (zh) 一种基于路网敏感特征的车辆轨迹聚类方法
CN106997666A (zh) 一种利用手机信令数据位置切换获取交通流速度的方法
CN106448173A (zh) 一种基于手机数据的长距离出行交通方式划分方法
CN110472999A (zh) 基于地铁和共享单车数据的客流模式分析方法及装置
CN107170236A (zh) 一种基于浮动车数据的路网重要交叉口提取方法
CN111341135A (zh) 基于兴趣点及导航数据的手机信令数据出行方式识别方法
CN110160538A (zh) 一种基于手机信令数据的地图匹配方法
CN112000755A (zh) 一种基于手机信令数据的区域出行廊道识别方法
CN115795332A (zh) 一种用户出行模式识别的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant