CN110913345B - 一种基于手机信令数据的断面客流计算方法 - Google Patents

一种基于手机信令数据的断面客流计算方法 Download PDF

Info

Publication number
CN110913345B
CN110913345B CN201911119105.8A CN201911119105A CN110913345B CN 110913345 B CN110913345 B CN 110913345B CN 201911119105 A CN201911119105 A CN 201911119105A CN 110913345 B CN110913345 B CN 110913345B
Authority
CN
China
Prior art keywords
base station
track
section
cross
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911119105.8A
Other languages
English (en)
Other versions
CN110913345A (zh
Inventor
张奇
刘芷辰
刘志远
付晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN201911119105.8A priority Critical patent/CN110913345B/zh
Publication of CN110913345A publication Critical patent/CN110913345A/zh
Application granted granted Critical
Publication of CN110913345B publication Critical patent/CN110913345B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W64/00Locating users or terminals or network equipment for network management purposes, e.g. mobility management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于手机信令数据的断面客流计算方法,包括如下步骤:(1)从手机信令数据中提取原始基站轨迹序列,每一个轨迹点包含基站地理位置坐标和时间戳,利用混合降噪算法以处理轨迹的空间不确定性问题;(2)从基站层面基于最短路的思想在稀疏的轨迹数据中进行插值,对降噪后的轨迹补全以获得连续的基站轨迹;(3)基于对断面客流的定义,统计穿过断面的轨迹数量,用折减系数对估算值进行修正,得到断面客流量。本发明通过对原始轨迹数据进行降噪和补全处理,计算一定时间内通过任意形状、任意长度的断面的客流数,除了考虑起终点信息以外,利用更精确的轨迹信息来计算断面客流。

Description

一种基于手机信令数据的断面客流计算方法
技术领域
本发明涉及交通大数据应用领域,尤其是一种基于手机信令数据的断面客流计算方法。
背景技术
断面客流是指在特定时间间隔内穿过指定断面(例如河流,山脉,铁路线等)的出行者的数量。断面客流了解道路客流量在时间、空间上的变化和分布规律,通过计算得到全日及分时段交通客流量、方向不均衡系数、高峰小时系数、区域交换量,进而研究全市宏观交通客流量变化趋势,为交通规划、道路建设和管理、工程经济分析提供必要的依据。
传统的断面客流由人工调查的方式获得,调查人员手动记录相关道路上的车辆数量作为断面客流。然而,这种方法费用昂贵且缺乏时效性,并且仅能获得通过固定断面的流量。以往研究有利用智能刷卡数据和GPS数据等以实时和大规模地获得断面客流信息,但由于此类运行数据通常由不同的运营者手机,因此利用运行数据仅能获得单一交通方式的出行者通过断面的信息。手机信令数据具有全样本性,基于手机信令数据计算断面客流可以克服上述缺点,有覆盖面广、手机成本低、更新频率快等优点。
在已有利用手机信令数据计算断面客流的研究中,穿过断面的出行者被定义为出行的起点和终点位于断面的不同侧的出行者,但此种方法在截面长度短、位置不固定式难以使用。同时,出行起终点的判别依赖于提前设定的时间阈值和速度阈值,不准确的阈值选择会造成断面客流的计算失真。
发明内容
本发明所要解决的技术问题在于,提供一种基于手机信令数据的断面客流计算方法,通过对原始轨迹数据进行降噪和补全处理,计算一定时间内通过任意形状、任意长度的断面的客流数,除了考虑起终点信息以外,利用更精确的轨迹信息来计算断面客流。
为解决上述技术问题,本发明提供一种基于手机信令数据的断面客流计算方法,包括如下步骤:
(1)从手机信令数据中提取原始基站轨迹序列,每一个轨迹点包含基站地理位置坐标和时间戳,利用混合降噪算法以处理轨迹的空间不确定性问题;
(2)从基站层面基于最短路的思想在稀疏的轨迹数据中进行插值,对降噪后的轨迹补全以获得连续的基站轨迹;
(3)基于对断面客流的定义,统计穿过断面的轨迹数量,用折减系数对估算值进行修正,得到断面客流量。
优选的,步骤(1)中,从手机信令数据中提取原始基站轨迹序列,每一个轨迹点包含基站地理位置坐标和时间戳,利用混合降噪算法以处理轨迹的空间不确定性问题具体为:
由三个过程组成的混合过滤算法来解决手机信令数据定位中的两种空间不确定性问题:定位误差和振荡;混合过滤算法以应用于过程1利用时间阈值以过滤不可靠轨迹点开始,过程2删除定位错误产生的无意义轨迹点,过程3通过去除复杂的振荡模式来平滑基站轨迹;
过程1:时间阈值处理;
手机信令数据指手机信令数据,每一条数据中包含客户端ID、客户端连接的基站编号,该基站的位置和数据产生的时间戳;定义基站元胞为基站所覆盖的服务面积,用泰森多边形进行表示,且位于该基站所属的泰森多边形内的任意点至该基站的距离要小于至其他基站的距离;bi表示基站,ci表示该基站对应到基站元胞,位于基站bi服务面积内的一点表示为pinci,如果基站元胞ci和基站元胞cj有公共边,则认为bi和bj相邻,如下式(1)中,手机信令数据集中的一条数据由客户端在该点所连接基站的坐标和对应的时间戳表示;
dn=(xn,yn,tn) (1)
式中dn代表轨迹中第n个轨迹点,(xn,yn)是客户端在该点所连接基站bn的坐标,tn是该客户端进入基站bn所对应的基站元胞cn范围内的时间戳,基站轨迹由轨迹点序列表示;
Tram={d1,d2,...,dn} (2)
式中Tram表示客户端m的基站轨迹;
基站轨迹序列Tram中记录的基站序列表示为Basem,对应的基站元胞序列表示为Cellm,基站对(bi,bi+1)表示基站序列Basem中的一对连续基站,如果所有的轨迹内的基站Basem都与其下一个基站相邻,则该基站轨迹Tram被认为是连续的;
过程1利用原始手机信令数据中的时间信息,考虑到时间不确定问题通常发生在较短的时间内,因此认为在基站停留时间长的数据点有更高的可信度,即停留时间小于时间阈值的轨迹点不能反应客户端的真实位置,对上述点进行删除,单个轨迹点的停留时间阈值按照下式计算;
durn=tn+1-tn (3)
式中,durn代表第n个轨迹点的停留时间;
过程1删除停留时间小于停留阈值的轨迹点,设置合理的停留时间阈值在实际工程中能有效压缩数据量,提高运算速度,减少对计算机储存空间的要求;同时,此过程能简化复杂的轨迹点震荡模式,有效提高步骤三中平滑算法的精度;
过程2:基于时间窗口的聚类算法;
基于时间窗口的聚类算法能处理小空间范围内手机信令数据定位错误的问题,使用长度n1=3的滑动窗口,窗口中覆盖的轨迹点构成三角形,利用公式(4)计算三角形的重心;
Figure BDA0002274923890000031
式中,pc代表三角形的重心,(xc,yc)表示三角形重心pc的坐标,(xi,yi)表示位于滑动窗口内轨迹点的坐标;
如果滑动窗口内所有的轨迹点均符合公式(5),则认为滑动窗口内所有的轨迹点可以被聚类;
dist(bi,pc)>θ1 (5)
式中dist(bi,pc)代表轨迹点bi与重心pc的欧几里得距离,θ1代表聚类距离阈值;
根据轨迹点的定义,需要将聚类中心的坐标转换为基站所在坐标,用重心pc所在泰森多边形内的基站位置代替重心pc坐标;本过程使用长度为n1=3的滑动窗口,可移除模式为{b1,b2,b1}和{b1,b2,b3}的基站局部定位错误,其中b1,b2和b3代表距离近的三个基站;同时,大于两个的距离很近的相邻异常轨迹点,也在此过程中被一个聚类中心替代;
过程3:基于模式识别的轨迹平滑;
此过程基于模式识别以平滑轨迹以解决的手机信令数据的震荡问题;根据定义,异常轨迹点是距离远于真实轨迹的手机信令数据轨迹点,异常轨迹点簇表示存在连续多个距离很近的异常轨迹点,由于过程2已经移除含有大于2个异常轨迹点的异常轨迹点簇,因此本过程中仅需要考虑异常轨迹点或有2个异常轨迹点的异常轨迹点簇;
长度n2=3滑动窗口移除单个异常轨迹点,对于位于滑动窗口内的轨迹点序列{bi,bi+1,bi+2},符合式(6)的轨迹点bi被判定为异常轨迹点;
Figure BDA0002274923890000041
式中θ2表示两个正确轨迹点中的最大可能距离,最大可能距离可由基站分布推断得到;
用长度n2=4滑动窗口移除有2个异常轨迹点的异常轨迹点簇,对于位于滑动窗口内的轨迹点序列{bi,bi+1,bi+2,bi+3},符合式(7)的轨迹点bi+1和bi+2被判定为异常轨迹点;
Figure BDA0002274923890000042
式中θ2表示两个正确轨迹点中的最大可能距离。
优选的,步骤(2)中,从基站层面基于最短路的思想在稀疏的轨迹数据中进行插值,对降噪后的轨迹补全以获得连续的基站轨迹具体为:
两个连续轨迹点的时间间隔可能过长,数据点过于稀疏,以至于不能反映客户端的真实移动轨迹,为解决上述空间不确定性问题,步骤(2)使用基站层面的路径补全方法,基于最短距离的思想,在稀疏的轨迹点中插入轨迹点以获得连续的手机轨迹;
根据定义,如果所有的轨迹内的基站Basem都与其下一个基站相邻,则该基站轨迹Tram被认为是连续的,轨迹Tram中的每一个轨迹点对(bi,bi+1)可得到以此两个轨迹点为端点的线段bibi+1。如果线段bibi+1的中点pm所在基站元胞Cellm不在现有基站轨迹内,则将中点pm所在基站bm插入基站轨迹,直到轨迹内所有的基站对(bi,bi+1)均相邻;
本发明采用的基站层面的轨迹补全方法,具体求解方案分为以下四个步骤:
步骤0:输入原始基站轨迹与基站坐标;
步骤1:将基站对(bi,bi+1)按照其长度L(bi,bi+1)排序;
步骤2:按照排序后的顺序,对于每一个基站对(bi,bi+1),计算其对应线段中点
Figure BDA0002274923890000051
步骤3:如果中点pm不属于元胞Cellm,则将bm插入(bi,bi+1)之间;
步骤4:重复步骤2和步骤3直到所有的轨迹内的基站bi都与其下一个基站bi+1相邻;
上述算法中基站对的长度L(bi,bj)可用动态规划的算法提高求解效率;
步骤0:输入基站坐标;
步骤1:如果基站bi与基站bj相邻,则L(bi,bj)=2。否则转入步骤2;
步骤2:计算
Figure BDA0002274923890000052
pm∈cm,将基站对的长度更新为L(bi,bj)=L(bi,bm)+L(bm,bj)-1;
步骤3:遍历所有的轨迹对。
优选的,步骤(3)中,基于对断面客流的定义,统计穿过断面的轨迹数量,用折减系数对估算值进行修正,得到断面客流量具体为:
利用步骤(2)中得到的连续基站轨迹计算断面客流,在二维空间里,给定断面的起点ps和终点pe,断面表示为向量
Figure BDA0002274923890000053
C表示被断面切割到的基站元胞组成的集合,B代表C中元胞对应的基站;
利用穿过断面的连续基站轨迹的数量计算断面客流,引入右手定则以区分断面两端的客流,根据式(8)穿过断面的基站轨迹Tram满足下列条件:(i)如果轨迹中存在基站对(bi,bi+1),该基站对所对应的线段bibi+1与断面端点对应的线段pspe相交;(ii)断面向量
Figure BDA0002274923890000054
与轨迹对向量
Figure BDA0002274923890000055
之间的方向满足右手螺旋定则;具体计算过程中,利用两向量间的旋转角判定两线段是否相交;在此步骤中,仅需要对仅有包含至少一个bi∈B的轨迹对需要计算;
Figure BDA0002274923890000061
由于在断面的端点处穿过断面的基站轨迹其真实轨迹可能并不穿过断面,因此需要对在断面的端点处穿过断面的基站轨迹进行系数折减,式(9)中折减系数定义为断面在公共边上的投影长度与公共边长度的比值;
Figure BDA0002274923890000062
式中
Figure BDA0002274923890000063
Figure BDA0002274923890000064
表示公共边的端点,
Figure BDA0002274923890000065
是基站对(bi,bi+1)的折减系数,断面客流的计算值为:
Figure BDA0002274923890000066
式中
Figure BDA0002274923890000067
代表断面客流的计算值,
Figure BDA0002274923890000068
是集记后的通过断面的基站对(bi,bi+1)的数量。
本发明的有益效果为:本发明提出了一个新的框架来处理从手机信令数据导出的原始轨迹,获得连续轨迹,并基于这些连续轨迹计算出行者的截面体积,该框架包括三个阶段,在前两个阶段中,通过提出混合过滤算法和新颖的小区到小区路径推断算法,明确地解决了手机信令数据的空间和时间不确定性,三阶段框架在低平均错误率下表现良好。
附图说明
图1为本发明的方法流程示意图。
图2为本发明的基站轨迹示意图。
图3为本发明基站层面的轨迹补全前示意图。
图4为本发明基站层面的轨迹补全后示意图。
图5为本发明的断面客流计算示意图。
图6为本发明的典型断面示意图。
图7为本发明聚类距离阈值敏感性分析示意图。
图8为本发明最大可能距离敏感性分析示意图。
具体实施方式
如图1所示,一种基于手机信令数据的断面客流计算方法,包括如下步骤:
1)从手机信令数据中提取原始基站轨迹序列,每一个轨迹点包含基站地理位置坐标和时间戳,利用混合降噪算法以处理轨迹的空间不确定性问题。
过程1:时间阈值处理
本发明中手机信令数据指手机信令数据,每一条数据中包含客户端ID、客户端连接的基站编号,该基站的位置和数据产生的时间戳。定义基站元胞为基站所覆盖的服务面积,用泰森多边形进行表示,且位于该基站所属的泰森多边形内的任意点至该基站的距离要小于至其他基站的距离。bi表示基站,ci表示该基站对应到基站元胞。位于基站bi服务面积内的一点表示为pinci。如果基站元胞ci和基站元胞cj有公共边,则认为bi和bj相邻,如下图2所示。手机信令轨迹集中的一条数据由客户端在该点所连接基站的坐标和对应的时间戳表示方法如下式:
dn=(xn,yn,tn) (1)
式中dn代表轨迹中第n个轨迹点,(xn,yn)是客户端在该点所连接基站bn的坐标,tn是该客户端进入基站bn所对应的基站元胞cn范围内的时间戳,基站轨迹由轨迹点序列表示。
Tram={d1,d2,...,dn} (2)
式中Tram表示客户端m的基站轨迹。
基站轨迹序列Tram中记录的基站序列表示为Basem,对应的基站元胞序列表示为Cellm。基站对(bi,bi+1)表示基站序列Basem中的一对连续基站。如果所有的轨迹内的基站Basem都与其下一个基站相邻,则该基站轨迹Tram被认为是连续的。
过程1利用原始手机信令数据中的时间信息,考虑到时间不确定问题通常发生在较短的时间内,因此认为在基站停留时间长的数据点有更高的可信度,即停留时间小于时间阈值的轨迹点不能反应客户端的真实位置,对上述点进行删除。单个轨迹点的停留时间阈值按照下式计算。
durn=tn+1-tn (3)
式中,durn代表第n个轨迹点的停留时间。
过程1删除停留时间小于停留阈值的轨迹点,设置合理的停留时间阈值在实际工程中能有效压缩数据量,提高运算速度,减少对计算机储存空间的要求。同时,此过程能简化复杂的轨迹点震荡模式,有效提高步骤三中平滑算法的精度。
过程1删除停留时间小于停留阈值的轨迹点,在真实的手机信令数据中,有相当大一部分的轨迹点停留时间均小于3秒,因此推荐采用3至5秒作为时间阈值。
过程2:基于时间窗口的聚类算法
基于时间窗口的聚类算法能处理小空间范围内手机信令数据定位错误的问题。使用长度n1=3的滑动窗口,窗口中覆盖的轨迹点构成三角形。利用公式(4)计算三角形的重心。
Figure BDA0002274923890000081
式中,pc代表三角形的重心,(xc,yc)表示三角形重心pc的坐标,(xi,yi)表示位于滑动窗口内轨迹点的坐标。
如果滑动窗口内所有的轨迹点均符合公式(5),则认为滑动窗口内所有的轨迹点可以被聚类。
dist(bi,pc)>θ1 (5)
式中dist(bi,pc)代表轨迹点bi与重心pc的欧几里得距离。θ1代表聚类距离阈值。
根据轨迹点的定义,需要将聚类中心的坐标(通常不予基站坐标重合)转换为基站所在坐标,用重心pc所在泰森多边形内的基站位置代替重心pc坐标。本过程使用长度为n1=3的滑动窗口,可移除模式为{b1,b2,b1}和{b1,b2,b3}的基站局部定位错误(其中b1,b2和b3代表距离近的三个基站)。同时,大于两个的距离很近的相邻异常轨迹点,也在此过程中被一个聚类中心替代。在本案例中,聚类距离阈值θ1设为1千米。
过程3:基于模式识别的轨迹平滑
此过程基于模式识别以平滑轨迹以解决的手机信令数据的震荡问题。根据定义,异常轨迹点是距离远于真实轨迹的手机信令数据轨迹点。异常轨迹点簇表示存在连续多个距离很近的异常轨迹点。由于过程2已经移除含有大于2个异常轨迹点的异常轨迹点簇,因此本过程中仅需要考虑异常轨迹点或有2个异常轨迹点的异常轨迹点簇。
长度n2=3滑动窗口移除单个异常轨迹点。对于位于滑动窗口内的轨迹点序列{bi,bi+1,bi+2},符合式(6)的轨迹点bi被判定为异常轨迹点。
Figure BDA0002274923890000091
式中θ2表示两正确轨迹点中的最大可能距离,最大可能距离可由基站分布推断得到。
用长度n2=4滑动窗口移除有2个异常轨迹点的异常轨迹点簇。对于位于滑动窗口内的轨迹点序列{bi,bi+1,bi+2,bi+3},符合式(7)的轨迹点bi+1和bi+2被判定为异常轨迹点。
Figure BDA0002274923890000092
式中θ2表示两正确轨迹点中的最大可能距离。
本案例中,最大可能距离阈值θ2设为5千米。
2)从基站层面基于最短路的思想在稀疏的轨迹数据中进行插值,对降噪后的轨迹补全以获得连续的基站轨迹。步骤2使用基站层面的路径补全方法,基于最短距离的思想,在稀疏的轨迹点中插入轨迹点以获得连续的手机轨迹。具体求解方案分为以下四个步骤:
步骤0:输入原始基站轨迹与基站坐标;
步骤1:将基站对(bi,bi+1)按照其长度L(bi,bi+1)排序;
步骤2:按照排序后的顺序,对于每一个基站对(bi,bi+1),计算其对应线段中点
Figure BDA0002274923890000101
步骤3:如果中点pm不属于元胞Cellm,则将bm插入(bi,bi+1)之间;
步骤4:重复步骤2和步骤3直到所有的轨迹内的基站bi都与其下一个基站bi+1相邻。
上述算法中基站对的长度L(bi,bj)可用动态规划的算法提高求解效率。
步骤0:输入基站坐标;
步骤1:如果基站bi与基站bj相邻,则L(bi,bj)=2。否则转入步骤2;
步骤2:计算
Figure BDA0002274923890000102
pm∈cm,将基站对的长度更新为L(bi,bj)=L(bi,bm)+L(bm,bj)-1;
步骤3:遍历所有的轨迹对。
轨迹补全前后示意图如图3和图4所示。
3)基于对断面客流的定义,统计穿过断面的轨迹数量,用折减系数对估算值进行修正,得到断面客流量。
步骤3)利用步骤2)中得到的连续基站轨迹计算断面客流。在二维空间里,给定断面的起点ps和终点pe,断面表示为向量
Figure BDA0002274923890000103
C表示被断面切割到的基站元胞组成的集合,B代表C中元胞对应的基站。
利用穿过断面的连续基站轨迹的数量计算断面客流。引入右手定则以区分断面两端的客流。根据式(8)穿过断面的基站轨迹Tram满足下列条件:(i)如果轨迹中存在基站对(bi,bi+1),该基站对所对应的线段bibi+1与断面端点对应的线段pspe相交;(ii)断面向量
Figure BDA0002274923890000104
与轨迹对向量
Figure BDA0002274923890000105
之间的方向满足右手螺旋定则。具体计算过程中,利用两向量间的旋转角判定两线段是否相交。图5为断面客流计算示意图。在此步骤中,仅需要对仅有包含至少一个bi∈B的轨迹对需要计算。
Figure BDA0002274923890000111
由于在断面的端点处穿过断面的基站轨迹其真实轨迹可能并不穿过断面,因此需要对在断面的端点处穿过断面的基站轨迹进行系数折减。式(9)中折减系数定义为断面在公共边上的投影长度与公共边长度的比值。
Figure BDA0002274923890000112
式中
Figure BDA0002274923890000113
Figure BDA0002274923890000114
表示公共边的端点。
Figure BDA0002274923890000115
是基站对(bi,bi+1)的折减系数。断面客流的计算值为:
Figure BDA0002274923890000116
式中
Figure BDA0002274923890000117
代表断面客流的计算值,
Figure BDA0002274923890000118
是集记后的通过断面的基站对(bi,bi+1)的数量。典型断面示意图如图6所示。
选取三个典型断面进行验证。断面1与长江平行,起点坐标ps1=(118.50,31.8),终点坐标pe1=(119.20,32.30),穿过断面1的客流多为长江南北两岸的长距离出行者。断面2为跨过市中心的短断面,断面起点坐标ps2=(118.75,31.93),中点坐标pe2=(118.90,31.98)。为了验证客流当以的向量性,断面3由断面2交换起终点得到,断面3起点坐标ps3=(118.90,31.98),中点坐标pe3=(118.75,31.93)。
本发明利用准确率为验证标准,其定义为:
Figure BDA0002274923890000119
式中,E代表准确率,y代表断面客流的真实值。
表1中为,三个典型断面的起终点、真实客流值、计算客流值和准确率,表中本案例中使用的真实值由人工标记获得。
表1典型断面计算结果
Figure BDA0002274923890000121
对混合降噪过程中的聚类距离阈值和最大可能距离进行敏感性分析,得到结果如图7和图8,敏感性分析的结果表明,错误率随着聚类距离阈值的增加而减小,而错误率和最大可能距离存在非线性关系。

Claims (1)

1.一种基于手机信令数据的断面客流计算方法,其特征在于,包括如下步骤:
(1)从手机信令数据中提取原始基站轨迹序列,每一个轨迹点包含基站地理位置坐标和时间戳,利用混合降噪算法以处理轨迹的空间不确定性问题;具体为:
由三个过程组成的混合过滤算法来解决手机信令数据定位中的两种空间不确定性问题:定位误差和振荡;混合过滤算法以应用于过程1利用时间阈值以过滤不可靠轨迹点开始,过程2删除定位错误产生的无意义轨迹点,过程3通过去除复杂的振荡模式来平滑基站轨迹;
过程1:时间阈值处理;
手机信令数据指手机信令数据,每一条数据中包含客户端ID、客户端连接的基站编号,该基站的位置和数据产生的时间戳;定义基站元胞为基站所覆盖的服务面积,用泰森多边形进行表示,且位于该基站所属的泰森多边形内的任意点至该基站的距离要小于至其他基站的距离;bi表示基站,ci表示该基站对应到基站元胞,位于基站bi服务面积内的一点表示为pinci,如果基站元胞ci和基站元胞cj有公共边,则认为bi和bj相邻,如下式(1)中,手机信令数据集中的一条数据由客户端在该点所连接基站的坐标和对应的时间戳表示;
dn=(xn,yn,tn) (1)
式中dn代表轨迹中第n个轨迹点,(xn,yn)是客户端在该点所连接基站bn的坐标,tn是该客户端进入基站bn所对应的基站元胞cn范围内的时间戳,基站轨迹由轨迹点序列表示;
Tram={d1,d2,...,dn} (2)
式中Tram表示客户端m的基站轨迹;
基站轨迹序列Tram中记录的基站序列表示为Basem,对应的基站元胞序列表示为Cellm,基站对(bi,bi+1)表示基站序列Basem中的一对连续基站,如果所有的轨迹内的基站Basem都与其下一个基站相邻,则该基站轨迹Tram被认为是连续的;
过程1利用原始手机信令数据中的时间信息,考虑到时间不确定问题通常发生在较短的时间内,因此认为在基站停留时间长的数据点有更高的可信度,即停留时间小于时间阈值的轨迹点不能反应客户端的真实位置,对上述点进行删除,单个轨迹点的停留时间阈值按照下式计算;
durn=tn+1-tn (3)
式中,durn代表第n个轨迹点的停留时间;
过程2:基于时间窗口的聚类算法;
基于时间窗口的聚类算法能处理小空间范围内手机信令数据定位错误的问题,使用长度n1=3的滑动窗口,窗口中覆盖的轨迹点构成三角形,利用公式(4)计算三角形的重心;
Figure FDA0002774275190000021
式中,pc代表三角形的重心,(xc,yc)表示三角形重心pc的坐标,(xi,yi)表示位于滑动窗口内轨迹点的坐标;
如果滑动窗口内所有的轨迹点均符合公式(5),则认为滑动窗口内所有的轨迹点可以被聚类;
dist(bi,pc)>θ1 (5)
式中dist(bi,pc)代表基站bi的坐标与重心pc的欧几里得距离,θ1代表聚类距离阈值;
根据轨迹点的定义,需要将聚类中心的坐标转换为基站所在坐标,用重心pc所在泰森多边形内的基站位置代替重心pc坐标;本过程使用长度为n1=3的滑动窗口,可移除模式为{b1,b2,b1}和{b1,b2,b3}的基站局部定位错误,其中b1,b2和b3代表距离近的三个基站;同时,大于两个的距离很近的相邻异常轨迹点,也在此过程中被一个聚类中心替代;
过程3:基于模式识别的轨迹平滑;
此过程基于模式识别以平滑轨迹以解决的手机信令数据的震荡问题;根据定义,异常轨迹点是距离远于真实轨迹的手机信令数据轨迹点,异常轨迹点簇表示存在连续多个距离很近的异常轨迹点,由于过程2已经移除含有大于2个异常轨迹点的异常轨迹点簇,因此本过程中仅需要考虑异常轨迹点或有2个异常轨迹点的异常轨迹点簇;
长度n2=3滑动窗口移除单个异常轨迹点,对于位于滑动窗口内的基站序列{bi,bi+1,bi+2},符合式(6)的基站bi被判定为轨迹点i存在异常的基站;
Figure FDA0002774275190000031
式中θ2表示两正确轨迹点中的最大可能距离,最大可能距离可由基站分布推断得到;
用长度n2=4滑动窗口移除有2个异常轨迹点的异常轨迹点簇,对于位于滑动窗口内的基站序列{bi,bi+1,bi+2,bi+3},符合式(7)的基站bi被判定为轨迹点i存在异常的基站;
Figure FDA0002774275190000032
式中θ2表示两正确轨迹点中的最大可能距离;
(2)从基站层面基于最短路的思想在稀疏的轨迹数据中进行插值,对降噪后的轨迹补全以获得连续的基站轨迹;具体为:
两个连续轨迹点的时间间隔可能过长,数据点过于稀疏,以至于不能反映客户端的真实移动轨迹,为解决上述空间不确定性问题,步骤(2)使用基站层面的路径补全方法,基于最短距离的思想,在稀疏的轨迹点中插入轨迹点以获得连续的手机轨迹;
如果所有的轨迹内的基站Basem都与其下一个基站相邻,则该基站轨迹Tram被认为是连续的,轨迹Tram中的每一个基站对(bi,bi+1)可得到以此两个轨迹点为端点的线段bibi+1;如果线段bibi+1的中点pm所在基站元胞Cellm不在现有基站轨迹内,则将中点pm所在基站bm插入基站轨迹,直到轨迹内所有的基站对(bi,bi+1)均相邻;
采用的基站层面的轨迹补全方法,具体求解方案分为以下四个步骤:
步骤0:输入原始基站轨迹与基站坐标;
步骤1:将基站对(bi,bi+1)按照其长度L(bi,bi+1)排序;
步骤2:按照排序后的顺序,对于每一个基站对(bi,bi+1),计算其对应线段中点
Figure FDA0002774275190000041
步骤3:如果中点pm不属于元胞Cellm,则将bm插入(bi,bi+1)之间;
步骤4:重复步骤2和步骤3直到所有的轨迹内的基站bi都与其下一个基站bi+1相邻;
上述算法中基站对的长度L(bi,bj)可用动态规划的算法提高求解效率;
步骤0:输入基站坐标;
步骤1:如果基站bi与基站bj相邻,则L(bi,bj)=2,否则转入步骤2;
步骤2:计算
Figure FDA0002774275190000042
将基站对的长度更新为L(bi,bj)=L(bi,bm)+L(bm,bj)-1;
步骤3:遍历所有的轨迹对;
(3)基于对断面客流的定义,统计穿过断面的轨迹数量,用折减系数对估算值进行修正,得到断面客流量;具体为:
利用步骤(2)中得到的连续基站轨迹计算断面客流,在二维空间里,给定断面的起点ps和终点pe,断面表示为向量
Figure FDA0002774275190000043
C表示被断面切割到的基站元胞组成的集合,B代表C中元胞对应的基站;
利用穿过断面的连续基站轨迹的数量计算断面客流,引入右手定则以区分断面两端的客流,根据式(8)穿过断面的基站轨迹Tram满足下列条件:(i)如果轨迹中存在基站对(bi,bi+1),该基站对所对应的线段bibi+1与断面端点对应的线段pspe相交;(ii)断面向量
Figure FDA0002774275190000044
与轨迹对向量
Figure FDA0002774275190000045
之间的方向满足右手螺旋定则;具体计算过程中,利用两向量间的旋转角判定两线段是否相交;在此步骤中,仅需要对仅有包含至少一个bi∈B的轨迹对需要计算;
Figure FDA0002774275190000046
由于在断面的端点处穿过断面的基站轨迹其真实轨迹可能并不穿过断面,因此需要对在断面的端点处穿过断面的基站轨迹进行系数折减,式(9)中折减系数定义为断面在公共边上的投影长度与公共边长度的比值;
Figure FDA0002774275190000051
式中
Figure FDA0002774275190000052
Figure FDA0002774275190000053
表示公共边的端点,
Figure FDA0002774275190000054
是基站对(bi,bi+1)的折减系数,断面客流的计算值为:
Figure FDA0002774275190000055
式中
Figure FDA0002774275190000056
代表断面客流的计算值,
Figure FDA0002774275190000057
是集记后的通过断面的基站对(bi,bi+1)的数量。
CN201911119105.8A 2019-11-15 2019-11-15 一种基于手机信令数据的断面客流计算方法 Active CN110913345B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911119105.8A CN110913345B (zh) 2019-11-15 2019-11-15 一种基于手机信令数据的断面客流计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911119105.8A CN110913345B (zh) 2019-11-15 2019-11-15 一种基于手机信令数据的断面客流计算方法

Publications (2)

Publication Number Publication Date
CN110913345A CN110913345A (zh) 2020-03-24
CN110913345B true CN110913345B (zh) 2021-01-05

Family

ID=69816903

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911119105.8A Active CN110913345B (zh) 2019-11-15 2019-11-15 一种基于手机信令数据的断面客流计算方法

Country Status (1)

Country Link
CN (1) CN110913345B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111521191A (zh) * 2020-04-20 2020-08-11 中国农业科学院农业信息研究所 一种基于信令数据的移动电话用户移动路径地图匹配方法
CN113053110A (zh) * 2020-12-23 2021-06-29 沈阳世纪高通科技有限公司 一种基于4g信令数据计算道路流量的方法及装置
CN113347574B (zh) * 2021-06-03 2023-04-07 中国联合网络通信集团有限公司 一种确定常驻地的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503843A (zh) * 2016-10-20 2017-03-15 上海萃图数字科技有限公司 一种基于手机信令数据的常规公交线网优化与调整方法
CN106960261A (zh) * 2017-03-27 2017-07-18 重庆邮电大学 一种基于轨道ic卡和手机信令数据的轨道交通客流预测方法
CN108876033A (zh) * 2018-06-13 2018-11-23 华南理工大学 一种基于多源数据融合的客流爆点人流量预测方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107277765A (zh) * 2017-05-12 2017-10-20 西南交通大学 一种基于聚类离群分析的手机信令轨迹预处理方法
CN110232817A (zh) * 2018-12-27 2019-09-13 上海君来软件有限公司 一种基于WiFi嗅探数据的高速公路路况分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503843A (zh) * 2016-10-20 2017-03-15 上海萃图数字科技有限公司 一种基于手机信令数据的常规公交线网优化与调整方法
CN106960261A (zh) * 2017-03-27 2017-07-18 重庆邮电大学 一种基于轨道ic卡和手机信令数据的轨道交通客流预测方法
CN108876033A (zh) * 2018-06-13 2018-11-23 华南理工大学 一种基于多源数据融合的客流爆点人流量预测方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
"Estimation Method of Section Passenger Flow Composition for Metro Network with Constraints of Time and Route";Huang Z , Xu R;《Tongji Daxue Xuebao/Journal of Tongji University》;20180701;全文 *
"Optimization of Urban Rail Transit Operation Plan Based on the Characteristics of Cross-section Passenger Flow";WANG Yonggang;ZHANG Jun;《Urban Mass Transit》;20170410;全文 *
"基于手机传感器数据的个体交通出行链信息采集方法研究";姚振兴;《中国博士学位论文全文数据库 工程科技Ⅱ辑》;20181015;全文 *
"基于手机信令数据的城市轨道交通客流出行信息提取方法研究";王利雷;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20180915;全文 *
"基于手机信令数据的城市轨道交通客流特征研究";杨彬彬;《中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑》;20160815;全文 *
Zhiying He;Jianling Huang."The prediction of passenger flow distribution for urban rail transit based on multi-factor model".《2016 IEEE International Conference on Intelligent Transportation Engineering (ICITE)》.2016, *

Also Published As

Publication number Publication date
CN110913345A (zh) 2020-03-24

Similar Documents

Publication Publication Date Title
CN110913345B (zh) 一种基于手机信令数据的断面客流计算方法
CN111862659B (zh) 一种gps轨迹数据匹配和补全的方法
CN108802776B (zh) 基于异常点剔除及轨迹压缩算法的公交gps纠偏方法
CN105241465B (zh) 一种道路更新的方法
CN111210612B (zh) 基于公交gps数据与站点信息提取公交线路轨迹的方法
CN108171993B (zh) 一种基于手机信令大数据的高速公路车辆速度计算方法
CN106840176A (zh) Gps时空数据增量路网实时更新和轨迹匹配系统
CN102156732B (zh) 基于特征站点的公交ic卡数据站点匹配方法
CN107784084A (zh) 基于车辆定位数据的路网生成方法及系统
CN110906940B (zh) 一种基于轨迹方向的车道边线聚合方法
CN103617731A (zh) 一种利用城市浮动车辆gps数据生成道路路网矢量地图的方法
CN106323301A (zh) 一种道路情报的获取方法及装置
CN104318781B (zh) 基于rfid技术的行程速度获取方法
CN104200042A (zh) 一种定位数据轨迹跟踪方法
CN105225282A (zh) 一种高速公路联网收费费率计算方法及装置
CN109147323A (zh) 一种用于公路客货运输指标统计的车辆gps数据处理方法
CN106899306A (zh) 一种保持移动特征的车辆轨迹线数据压缩方法
CN104217593A (zh) 一种面向手机移动速度的路况信息实时获取方法
CN108765961A (zh) 一种基于改进型限幅平均滤波的浮动车数据处理方法
CN107886189B (zh) 一种基于地铁刷卡数据进行路径旅行时间推断的方法
CN102867406B (zh) 一种应用车辆探测资料的交通路网生成方法
CN109766399A (zh) 一种基于轨迹的基站路测点选择方法
CN109121094A (zh) 伪码信令数据预处理与出行链识别方法
CN109615865B (zh) 一种基于od数据增量迭代式估计路段交通流量的方法
CN108171992B (zh) 一种基于手机信令大数据的平行公路车辆速度计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant