CN109035787A - 一种利用移动通信数据识别交通工具类别的方法 - Google Patents

一种利用移动通信数据识别交通工具类别的方法 Download PDF

Info

Publication number
CN109035787A
CN109035787A CN201811048538.4A CN201811048538A CN109035787A CN 109035787 A CN109035787 A CN 109035787A CN 201811048538 A CN201811048538 A CN 201811048538A CN 109035787 A CN109035787 A CN 109035787A
Authority
CN
China
Prior art keywords
track
vehicle
time
user
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811048538.4A
Other languages
English (en)
Other versions
CN109035787B (zh
Inventor
杨灿
张凌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201811048538.4A priority Critical patent/CN109035787B/zh
Publication of CN109035787A publication Critical patent/CN109035787A/zh
Application granted granted Critical
Publication of CN109035787B publication Critical patent/CN109035787B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/015Detecting movement of traffic to be counted or controlled with provision for distinguishing between two or more types of vehicles, e.g. between motor-cars and cycles
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)
  • Train Traffic Observation, Control, And Security (AREA)

Abstract

本发明公开了一种利用移动通信数据识别交通工具类别的方法,步骤如下:获取原始的基站定位数据,并划分轨迹片段;基于轨迹片段之间的时空匹配度,计算轨迹片段之间的匹配关系,构建匹配关系的拓扑结构图;利用轨迹的特征、预先定义的规则集以及匹配关系的拓扑结构图识别出轨迹片段所对应的交通工具类别。本发明无需安装额外的传感器和视频监控设备,不依赖车辆的各类参数信息,仅利用基站地址信息,从中提取出用户的移动轨迹,采用一系列预定义的规则,即可较为准确地识别交通工具的类别。本发明具有计算量小,识别效率高以及充分利用现有基站设备的优势。

Description

一种利用移动通信数据识别交通工具类别的方法
技术领域
本发明涉及计算机技术领域,具体涉及一种利用移动通信数据识别交通工具类别的方法。
背景技术
交通是一座城市乃至一个国家的命脉。得益于国民经济的增长以及科学技术的革新进步,人们的出行方式日渐丰富,“智能交通”的概念也应运而生。交通工具类别的识别,是“智能交通”中的一个重要课题,对于道路交通的部署和优化,有着深远的指导意义。目前主流的交通工具识别技术,主要有传感器技术和数字图像处理技术两大类。传感器技术即在道路上设置传感器以采集和记录交通工具的速度,重量,体积等信息,从而识别交通工具的类别,这类方法需要铺设大量的设备,前期建设与后期维护的成本较高,难以实现全面覆盖;数字图像处理技术,则利用监控摄像装置拍摄到的车辆的图像,提取其中的车辆标志,车辆形状等特征,对交通工具的类别作出判断,然而,这种方法对拍摄到的图像质量有较高的要求,若拍摄的画面分辨率较低,或是在雨雪雾天等恶劣天气条件下,识别的准确率会大幅下降。
专利CN 104835320 A公开了一种基于移动通信数据的交通流估算方法,其通过筛选出指定路段的基站地址序列,计算相邻蜂窝中用户数量差值绝对值的加权平均值,以估算某一时间段内的交通流量。但是,目前尚未有一种基于移动通信数据对用户所乘坐的交通工具类别进行判断的有效方法。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种利用移动通信数据识别交通工具类别的方法,该方法基于移动设备与基站通信时产生的状态信息,通过移动设备在不同时间所处的基站位置的变化,形成一系列轨迹片段,对这些轨迹片段进行特征提取,利用提取出的特征识别出轨迹片段的交通工具类别。
本发明的目的可以通过采取如下技术方案达到:
一种利用移动通信数据识别交通工具类别的方法,包含以下步骤:
步骤S1、获取原始数据。从蜂窝式移动通信网络的通信数据中获取移动设备用户所在基站的状态信息数据,记作时空点四元组集合A=<userID,timestamp,longitude,latitude>,其中userID表示能够区分不同用户的信息字段(如移动设备ID、网卡mac地址或手机号码),timestamp为时间戳,即该位置信息产生的时间点,longitude与latitude分别表示基站的经度和纬度,记用户总数为Nu
步骤S2、从用户的时空点序列中划分轨迹片段。利用步骤S1中获取的数据,得到各个移动用户所历经的时空点序列,通过计算用户在各个位置的停留时间长度,判断出用户每次移动的起点与终点。用户在某一时间段内,进行一次移动所产生的时空点序列,即为一条轨迹片段。如此可将一个用户的所有时空点序列,划分为一系列轨迹片段。
步骤S2的具体实施方法如下:
步骤S201、在步骤S1所提取到的时空四元组集合中,将相同userID的记录构成该用户的轨迹时空点序列,记作
ai,j=<userIDi,timestampi,j,longitudei,j,latitudei,j>。
步骤S202、将每一用户的数据点按照timestamp升序排列,得到按时间变化的数据点序列,记为
步骤S203、剔除步骤S202每一用户的序列Si中的异常点,将Si更新为:
步骤S204、将经过步骤S203处理后的每一用户的全体时空序列点Qi,分割成一系列轨迹片段。
步骤S205、将步骤S204得到的所有用户的轨迹片段进行汇总,记作
其中nti表示用户i的轨迹总数,表示用户i的第η条轨迹片段。
步骤S3、计算步骤S2中的不同用户轨迹片段之间的匹配关系,并构建匹配关系的拓扑结构图。
步骤S3的具体实施步骤如下:
步骤S301、对每一个满足(其中×表示集合的笛卡尔积),的轨迹片段对计算其时空匹配度(Mb为预先设定的匹配度的阈值,其值应当接近于1),则轨迹片段匹配轨迹片段记为则轨迹片段存在一个子片段,与轨迹片段与在时间与空间上高度匹配,可以认为用户q在该段时间内与用户p乘坐同一辆交通工具。若则说明轨迹片段不匹配轨迹片段记为至此,得出匹配关系。
步骤S302、构建全体轨迹片段间,匹配关系的拓扑结构图。匹配关系的拓扑结构图记为G={V,E},V为顶点的集合,全体轨迹片段集合Πall与图顶点集合V为一一对应关系,将轨迹片段在图中所对应的顶点记为为图中有向边的集合表示从顶点指向顶点的边)。
步骤S4、定义轨迹片段的各类属性特征以及基于这些判别交通工具类别的规则集,用于识别交通工具的类别。
其中,轨迹片段的各类属性特征如下:
额定行驶速度,即交通工具正常行驶时所能达到的速度,记为
额定行驶加速度,即交通工具正常行驶中加、减速时,所能达到的加速度,记为
位移,即轨迹片段起点到终点的直接距离,记为
标准速度与标准加速度,即交通工具所能达到的速度与加速度;
行驶路程,记为
聚集系数,即轨迹片段在同一时间段乘坐同一交通工具的人数,记为
频数,即该用户存在历经相似位置的轨迹片段数量,记为
步骤S5、按以下方法识别所有轨迹片段的交通工具类别:从交通工具类别未知的轨迹片段中,按一定规则寻找出一条匹配轨迹数较多的轨迹片段,运用步骤S4中的规则集识别该驾驶人轨迹片段的交通工具类别;之后利用步骤S3中构建的拓扑结构图,寻找出该轨迹片段匹配的所有轨迹片段,并将它们的交通工具类别标记为与该轨迹片段相同的类别;之后再从交通工具类别未知的轨迹片段中,按规则寻找出驾驶人轨迹片段,如此循环往复,直至所有轨迹片段的交通工具类别均已识别完成。
步骤S5的具体实施步骤如下:
步骤S501、令kS5=1;
步骤S502、按照一定的规则,从交通工具类别未知的轨迹片段中,选取一条匹配轨迹数较多的轨迹片段
步骤S503、利用步骤S4中构建的规则集,识别的交通工具类别;
步骤S504、记匹配的轨迹片段集合为
其中,E为图G的边集,将中,所有轨迹片段的交通工具类别标记为与相同的类别;
步骤S505、令从图G的顶点集合V中删去集合中所有轨迹片段所对应的顶点,并从图G的边集E中,删去所有包含有被删去的顶点的边;
步骤S506、若图G中的顶点数大于0,则依然存在交通工具类别未知的轨迹片段,令kS5=1,转步骤S502;若顶点数等于0,则所有轨迹片段的交通工具类别均已确定,整个识别过程全部完成。
进一步地,所述的步骤S203中,剔除异常点的具体过程如下:计算相邻两点ai,j到ai,j+1间的用户移动速度判断该速度是否大于预先设定的阈值vmax,若否,则保留点aij;若是,则从序列中删除点ai,j+1并更新j=j+1,重复该步骤至j=n结束。由此将Si更新为:
进一步地,所述的步骤S204中,将每一用户的全体时空序列点Qi,分割成一系列轨迹片段的具体步骤为:
步骤S20401、令kS204=1,J=1
步骤S20402、创建新的轨迹片段序列为当前轨迹片段的起点;
步骤S20403、计算数据点的时间差 判断是否大于预先设定的阈值Tborder,若是,则为当前的轨迹片段的终点,相应地,为下一条轨迹片段的起点,令kS204=kS204+1,J=J+1,转步骤S20402;若否,则在现有轨迹片段LJ的末尾添加点转步骤S20404;
步骤S20404、若kS204=mi-1,则结束执行,否则令kS204=kS204+1,转步骤S20403。
进一步地,所述的步骤S301中,计算时空匹配度的过程如下:
步骤S30101、选定时间间隔
其中len(·)表示轨迹片段的长度,即时空点的个数,时间窗口大小tw为轨迹片段中相邻时空点的最小时间差与轨迹片段中相邻时空点的最小时间差的较小者;
步骤S30102、记
其中分别表示轨迹片段的起点时间戳,分别表示轨迹片段的终点时间戳。将时间区间[tbegin,tend]以tw为间隔划分为个不重叠的时间窗口,各时间窗口分别记为:
Tw1=[tbegin,tbegin+tw)
Tw2=[tbegin+tw,tbegin+2tw)
Twn-1=[tbegin+(nw-2)tw,tbegin+(nw-1)tw)
Twnw=[tbegin+(nw-1)tw,tend]
步骤S30103、记Sp,λ(k),Sq,μ(k)分别为中,时间戳落在时间窗口Twk内的时空点集合,易知每一个Sp,λ(k)与Sq,μ(k)中至多只有一个元素,计算匹配的点数计算公式如下:
其中,为预先设定的阈值。
步骤S30104、计算对于的匹配度Mr,计算公式如下:
进一步地,所述的步骤S4中额定行驶速度的计算方式如下:
轨迹片段通过相邻两个时空点的速度记作
将上述速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值,其中top为预先设定的参数。
进一步地,所述的步骤S4中额定行驶加速度的计算方式如下:将轨迹片段通过相邻三个时空点的瞬时加速度记作将上述加速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值。
进一步地,所述的步骤S4中行驶路程的计算公式如下:
进一步地,所述的步骤S4中聚集系数匹配的轨迹数,即在拓扑结构图G中对应的顶点的出度。
进一步地,所述的步骤S4中频数的计算步骤如下:
a、令l=1,
b、计算的最长公共子序列,其计算方式如下:记为轨迹片段的前l1个时空点与轨迹片段的前l2个位置的最长公共子序列的长度,其计算公式如下:
c、若其中,Fb为预先设定好的阈值,其值接近于1,len(·)表示轨迹片段的长度,则令
d、若l=Ep,其中,Ep为用户p的轨迹片段总数,则计算完成,否则令l=l+1,转到步骤b。
进一步地,所述的步骤S4中判别交通工具类别的规则集定义如下:
规则S401、根据的取值,按如下技术方案对交通工具类别进行判别:
所属区间为[0,vwalk),则交通工具类别为无交通工具,即步行;
所属区间为[vbike,vlow),则交通工具类别为低速机动车,并转至使用规则S402作进一步判别;
所属区间为[vlow,vmid1),则交通工具类别为摩托车;
所属区间为[vmid1,vmid2),则交通工具类别为各类汽车、地铁或普快列车,并转至使用规则S403作进一步判别;
所属区间为[vmid2,vhigh),则交通工具类别为动车;
则交通工具类别为高铁;
其中,vwalk,vbike,vlow,vmid1,vmid2,vhigh均为预先设定的参数,其取值应满足vwalk<vbike<vlow<vmid1<vmid2<vhigh
规则S402、就路程与位移的比值以及聚集系数两个特征做进一步判别。若(其中rateroad为预先设定的参数),则轨迹的交通工具类别为在公路上行驶的低速机动车,否则交通工具类别应当为在非公路上行驶的低速机动车。若(其中clutour为预先设定的参数),则轨迹的交通工具类别为载客低速机动车,为非载客低速机动车。
规则S403、根据的取值,按以下技术方案对交通工具类别进行判别:
则交通工具类别为货车或小轿车,并按规则S404作进一步判别,
则交通工具类别为短途客运机动车,并按规则S405作进一步判别,
则交通工具类别为长途客运机动车,并按规则S406作进一步判别,
其中,dislong,clucoach均为预先设定的参数;
规则S404、若若其中accar为预先设定的参数,则轨迹的交通工具类别为货车,反之标记为小轿车;
规则S405、若其中clusub为预先设定的参数,且取值远大于clucoach,则轨迹的交通工具类别为市内轨道交通工具,若其中freqbus为预先设定的参数,则轨迹的交通工具类别为公共汽车,若则标记轨迹的交通工具类别为非公共汽车的其他客车。
规则S406、若其中clutrain为预先设定的参数,且取值远大于clucoach,则标记轨迹的交通工具类别为普快列车,反之标记轨迹的交通工具类别为长途客车。
进一步地,所述的步骤S502中,选取轨迹片段所按照的规则为:
规则(1):在图G中的对应顶点的出度最多,即匹配的轨迹数最多,
若满足规则(1)的轨迹片段不唯一,则应满足规则(2):为满足规则(1)的所有轨迹片段中,行驶路程最长的;
若满足规则(2)的轨迹片段仍然不唯一,则可以为满足规则(2)的轨迹片段中的任意一个。
本发明相对于现有技术具有如下的优点及效果:
本发明所提出的一种利用移动通信数据识别交通工具类别的方法,无需安装额外的传感器和视频监控设备,不依赖车辆的各类参数信息,仅通过精确度较低的基站定位信息,即可较为准确地识别交通工具的类别。
附图说明
图1是本发明实施例中利用移动通信数据的识别交通工具的总体流程图;
图2是本发明实施例中划分轨迹片段的流程图;
图3是本发明实施例中计算匹配关系的流程图;
图4是本发明实施例中判别交通工具类别的规则集示意图;
图5是本发明实施例中识别所有轨迹片段交通工具类别的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如附图1所示,一种利用移动通信数据识别交通工具类别的方法,主要包含如下步骤:
步骤S1、获取原始数据。从蜂窝式移动通信网络的通信数据中获取移动设备用户所在基站的状态信息数据,记作时空点四元组集合(A=<userID,timestamp,longitude,latitude>),其中userID表示能够区分不同用户的信息字段(如移动设备ID、网卡mac地址或手机号码),timestamp为时间戳,即该位置信息产生的时间点,longitude与latitude分别表示基站的经度和纬度。记用户总数为Nu
步骤S2、从用户的时空点序列中划分轨迹片段。利用步骤S1中获取的数据,得到各个移动用户所历经的时空点序列,通过计算用户在各个位置的停留时间长度,判断出用户每次移动的起点与终点。用户在某一时间段内,进行一次移动所产生的时空点序列,即为一条轨迹片段。如此可将一个用户的所有时空点序列,划分为一系列轨迹片段。
步骤S3、计算步骤S2中的不同用户轨迹片段之间的匹配关系,并构建匹配关系的拓扑结构图。
步骤S4、定义轨迹片段的各类属性特征以及基于这些特征进行判别的规则集,用于识别交通工具的类别。
步骤S5、按以下方法识别所有轨迹片段的交通工具类别。从交通工具类别未知的轨迹片段中,按一定规则寻找出一条匹配轨迹数较多的轨迹片段,运用步骤S4中的规则集识别该驾驶人轨迹片段的交通工具类别;之后利用步骤S3中构建的拓扑结构图,寻找出该轨迹片段匹配的所有轨迹片段,并将它们的交通工具类别标记为与该轨迹片段相同的类别;之后再从交通工具类别未知的轨迹片段中,按规则寻找出驾驶人轨迹片段,如此循环往复,直至所有轨迹片段的交通工具类别均已识别完成。
如附图2所示,步骤S2的具体实施方法如下:
步骤S201、将步骤S1中提取到的时空四元组集合,将相同userID的记录构成该用户的轨迹时空点序列,并将每一用户的时空点序列按照timestamp升序排列。用户i的第j个时空点记作:
ai,j=<userIDi,timestampi,j,longitudei,j,latitudei,j>。
用户i的全体时空点序列记为其中,ni为用户i的时空点个数。
步骤S202、剔除步骤S201每一用户的序列Si中的异常点:计算相邻两点ai,j到ai,j+1间的用户移动速度其中,dist(·,·)表示两个时空点基站之间的距离。判断vij是否大于预先设定的阈值vmax(本实施例中,vmax取600km/h),若否,则保留点aij;若是,则从序列中删除点ai,j+1并更新j=j+1,重复该步骤至j=n结束。由此将Si更新为:其中,mi为剔除异常点之后,用户i剩余的时空点个数,满足mi≤ni
步骤S203、将经过步骤S202处理后的各个用户的时空序列点Qi,分割为一系列轨迹片段,具体步骤如下:
步骤S20301、令kS203=1,r=1,J=1;
步骤S20302、记创建新的轨迹片段序列为当前轨迹片段的起点;
步骤S20303、设定Tborder为20分钟,计算数据点ai,k+1与ai,k的时间差判断是否大于预先设定的阈值Tborder,若是,则为当前的轨迹片段的终点,相应地,ai,k+1为下一条轨迹片段的起点,令k=k+1,J=J+1,r=1,转步骤S20302;若否,则记在现有轨迹片段LJ的末尾添加点转步骤S20304。
步骤S20304、若k=m-1,则结束执行,否则令k=k+1,r=r+1,转步骤S20303。
步骤S204、将步骤S203得到的所有用户的轨迹片段进行汇总,记作:
其中nti表示用户i的轨迹片段总数。
步骤S3的具体实施步骤如下:
步骤S301、对每一个满足的轨迹片段对其中×表示集合的笛卡尔积,如附图3所示,按如下方式计算匹配关系:
步骤S30101、选定时间间隔
其中len(·)表示轨迹片段的长度,即时空点的个数。tw为轨迹片段中相邻时空点的最小时间差与轨迹片段中相邻时空点的最小时间差的较小者。
步骤S30102、记
其中分别表示轨迹片段的起点时间戳;分别表示轨迹片段的终点时间戳。将时间区间[tbegin,tend]以tw为间隔划分为个不重叠的时间窗口,各时间窗口分别记为:
Tw1=[tbegin,tbegin+tw)
Tw2=[tbegin+tw,tbegin+2tw)
Twn-1=[tbegin+(nw-2)tw,tbegin+(nw-1)tw)
Twnw=[tbegin+(nw-1)tw,tend]
步骤S30103、记Sp,λ(k),Sq,μ(k)分别为中,时间戳落在时间窗口Twk内的时空点集合,易知每一个Sp,λ(k)与Sq,μ(k)中至多只有一个元素,计算匹配的点数计算公式如下:
其中,smin预先设定为50米。
步骤S30104、计算对于的匹配度Mr,计算公式如下:
(Mb设定为0.9),则轨迹片段匹配轨迹片段记为则轨迹片段存在一个子片段,与轨迹片段与在时间与空间上高度匹配,可以认为用户q在该段时间内与用户p乘坐同一辆交通工具。若则说明轨迹片段不匹配轨迹片段记为至此,得出匹配关系。
步骤S302、构建全体轨迹片段间,匹配关系的拓扑结构图。匹配关系的拓扑结构图记为G={V,E},V为顶点的集合,全体轨迹片段集合Пall与图顶点集合V为一一对应关系,将轨迹片段在图中所对应的顶点记为为图中有向边的集合( 表示从顶点指向顶点的边)。
步骤S4的具体实施步骤如下:定义轨迹片段的各类属性特征及其计算方式如下:
1.额定速度,即交通工具正常行驶时所能达到的速度,记为其计算方式如下:将轨迹片段通过相邻两个时空点的瞬时速度记作
将上述瞬时速度值序列
按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值,其中top设定为20。
2.额定加速度,即交通工具正常行驶中加(减)速时,所能达到的加速度,记作其计算方式如下:将轨迹片段通过相邻三个时空点的瞬时加速度记作 将上述瞬时加速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值。
3.位移,即轨迹片段起点到终点的直接距离(忽略所有中间点的路程)。记为其计算公式为:
4.行驶路程,记为其计算公式为:
5.聚集系数,即轨迹片段在同一时间段乘坐同一交通工具的人数,记为匹配的轨迹数,即在拓扑结构图G中对应的顶点的出度。
6.频数,即该用户存在历经相似位置的轨迹片段数量,记为
其计算步骤如下:
步骤a、令l=1,
步骤b、计算的最长公共子序列,其计算方式如下:记为轨迹片段的前l1个时空点与轨迹片段的前l2个位置的最长公共子序列的长度,其计算公式如下:
步骤c、若(Fb设定为0.9;len(·)表示轨迹片段的长度),则令
步骤d、若l=Ep(Ep为用户p的轨迹片段总数),则
计算完成,否则令l=l+1,转到步骤b。
如附图4所示,基于上述特征,定义判别交通工具类别的规则集如下:
规则S401、根据的取值,按下述方案对交通工具类别进行判别:
vwalk,vbike,vlow,vmid1,vmid2,vhigh分别设定为6km/h,20km/h,30km/h,40km/h,140km/h,200km/h。
规则S402、就路程与位移的比值以及聚集系数两个特征做进一步判别。若(rateroad的数值设定为3),则轨迹的交通工具类别为在公路上行驶的低速机动车(电动自行车),否则交通工具类别应当为在非公路上行驶的低速机动车。若(clutour的数值设定为10),则轨迹的交通工具类别为载客低速机动车(景区观光车),为非载客低速机动车(电动巡逻车)。
规则S403、根据的取值,按下述方案对交通工具类别进行判别:
其中,设定dislong为30km,设定clucoach为10。
规则S404、若(stdacccar设为5m/s2),则轨迹的交通工具类别为货车,反之标记为小轿车。
规则S405、若(clusub设定为100),则轨迹的交通工具类别为市内轨道交通工具(地铁,轻轨),若(其中freqbus的数值,设定为数据集天数跨度的5倍)。则轨迹的交通工具类别为公共汽车,若则标记轨迹的交通工具类别为非公共汽车的客车(校车,单位班车,旅游大巴)。
规则S406、若(clutrain设定为100),则标记轨迹的交通工具类别为普快列车,反之标记轨迹的交通工具类别为长途客车。
步骤S5的具体实施步骤如下:
步骤S501、令kS5=1。
步骤S502、按以下规则,从交通工具类别未知的轨迹片段中,选取一条轨迹片段
规则(1):在图G中的对应顶点的出度最多,即匹配的轨迹数最多。
若满足规则(1)的轨迹片段不唯一,则应满足规则(2):为满足规则(1)的所有轨迹片段中,行驶路程最长的。
若满足规则(2)的轨迹片段仍然不唯一,则可以为满足规则(2)的轨迹片段中的任意一个。
步骤S503、利用步骤S4中构建的规则集,识别的交通工具类别。
步骤S504、记匹配的轨迹片段集合为
其中,E为图G的边集。将中,所有轨迹片段的交通工具类别标记为与相同的类别。
步骤S505、令从图G的顶点集合V中删去集合中所有轨迹片段所对应的顶点,并从图G的边集E中,删去所有包含有被删去的顶点的边。
步骤S506、若图G中的顶点数大于0,则依然存在交通工具类别未知的轨迹片段,令kS5=1,转步骤S502。若顶点数等于0,则所有轨迹片段的交通工具类别均已确定,整个过程全部完成。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的方法包括下列步骤:
S1、获取原始数据,从蜂窝式移动通信网络的通信数据中获取移动设备用户所在基站的状态信息数据,记作时空点四元组集合A=<userID,timestamp,longitude,latitude>,其中userID表示能够区分不同用户的信息字段,timestamp为时间戳,即该位置信息产生的时间点,longitude与latitude分别表示基站的经度和纬度,记用户总数为Nu
S2、从用户的时空点序列中划分轨迹片段,利用步骤S1中获取的数据,得到各个移动用户所历经的时空点序列,通过计算用户在各个位置的停留时间长度,判断出用户每次移动的起点与终点,用户在某一时间段内,进行一次移动所产生的时空点序列,即为一条轨迹片段,如此重复,将一个用户的所有时空点序列,划分为一系列轨迹片段;
步骤S2过程如下:
S201、在步骤S1所提取到的时空四元组集合中,将相同userID的记录构成该用户的轨迹时空点序列,记作
ai,j=<userIDi,timestampi,j,longitudei,j,latitudei,j>;
S202、将每一用户的数据点按照timestamp升序排列,得到按时间变化的数据点序列,记为
S203、剔除步骤S202每一用户的序列Si中的异常点,将Si更新为:
S204、将经过步骤S203处理后的每一用户的全体时空序列点Qi,分割成一系列轨迹片段;
S205、将步骤S204得到的所有用户的轨迹片段进行汇总,记作 其中nti表示用户i的轨迹总数,表示用户i的第η条轨迹片段;
S3、计算步骤S2中的不同用户轨迹片段之间的匹配关系,并构建匹配关系的拓扑结构图;
步骤S3过程如下:
S301、对每一个满足的轨迹片段对计算其时空匹配度其中×表示集合的笛卡尔积,若Mb为预先设定的匹配度的阈值,其值接近于1,则轨迹片段匹配轨迹片段记为则轨迹片段存在一个子片段,与轨迹片段与在时间与空间上高度匹配,认为用户q在该段时间内与用户p乘坐同一辆交通工具,若则说明轨迹片段不匹配轨迹片段记为
S302、构建全体轨迹片段间,匹配关系的拓扑结构图,记为G={V,E},V为顶点的集合,全体轨迹片段集合Πall与图顶点集合V为一一对应关系,将轨迹片段在拓扑结构图中所对应的顶点记为 为拓扑结构图中有向边的集合, 表示从顶点指向顶点的边;
S4、定义轨迹片段的各类属性特征以及基于判别交通工具类别的规则集,用于识别交通工具的类别;
其中,轨迹片段的各类属性特征如下:
额定行驶速度,即交通工具正常行驶时所能达到的速度,记为
额定行驶加速度,即交通工具正常行驶中加、减速时,所能达到的加速度,记为
位移,即轨迹片段起点到终点的直接距离,记为
标准速度与标准加速度,即交通工具所能达到的速度与加速度;
行驶路程,记为
聚集系数,即轨迹片段在同一时间段乘坐同一交通工具的人数,记为
频数,即该用户存在历经相似位置的轨迹片段数量,记为
S5、按以下步骤识别所有轨迹片段的交通工具类别:
S501、令kS5=1;
S502、按照一定的规则,从交通工具类别未知的轨迹片段中,选取一条匹配轨迹数较多的轨迹片段
S503、利用步骤S4中构建的规则集,识别的交通工具类别;
S504、记匹配的轨迹片段集合为
其中,E为图G的边集,将中,所有轨迹片段的交通工具类别标记为与相同的类别;
S505、令从图G的顶点集合V中删去集合中所有轨迹片段所对应的顶点,并从图G的边集E中,删去所有包含有被删去的顶点的边;
S506、若图G中的顶点数大于0,则依然存在交通工具类别未知的轨迹片段,令kS5=1,转步骤S502;若顶点数等于0,则所有轨迹片段的交通工具类别均已确定,整个识别过程全部完成。
2.根据权利要求1所述的一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的步骤S203中,剔除异常点的过程如下:
计算相邻两点ai,j到ai,j+1间的用户移动速度 其中,dist(·,·)表示两个时空点基站之间的距离。判断该速度是否大于预先设定的阈值vmax,若否,则保留点aij;若是,则从序列中删除点ai,j+1并更新j=j+1,重复以上过程至j=n结束,由此将Si更新为:
3.根据权利要求1所述的一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的步骤S204中,将每一用户的全体时空序列点Qi,分割成一系列轨迹片段的过程如下:
S20401、令kS204=1,J=1;
S20402、创建新的轨迹片段序列为当前轨迹片段的起点;
S20403、计算数据点的时间差 判断是否大于预先设定的阈值Tborder,若是,则为当前的轨迹片段的终点,相应地,为下一条轨迹片段的起点,令kS204=kS204+1,J=J+1,转步骤S20402;若否,则在现有轨迹片段L J的末尾添加点转步骤S20404;
S20404、若kS204=mi-1,则结束执行,否则令kS204=kS204+1,转步骤S20403。
4.根据权利要求1所述的一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的步骤S301中,计算时空匹配度的过程如下:
S30101、选定时间窗口大小
其中len(·)表示轨迹片段的长度,即时空点的个数,时间窗口大小tw为轨迹片段中相邻时空点的最小时间差与轨迹片段中相邻时空点的最小时间差的较小者;
S30102、记
其中分别表示轨迹片段的起点时间戳,分别表示轨迹片段的终点时间戳,将时间区间[tbegin,tend]以tw为间隔划分为个不重叠的时间窗口,各时间窗口分别记为:
Tw1=[tbegin,tbegin+tw)
Tw2=[tbegin+tw,tbegin+2tw)
Twn-1=[tbegin+(nw-2)tw,tbegin+(nw-1)tw)
Twnw=[tbegin+(nw-1)tw,tend]
S30103、记Sp,λ(k),Sq,μ(k)分别为中,时间戳落在时间窗口Twk内的时空点集合,每一个Sp,λ(k)与Sq,μ(k)中至多只有一个元素,计算匹配的点数计算公式如下:
其中,smin为预先设定的阈值;
步骤S30104、计算对于的匹配度Mr,计算公式如下:
5.根据权利要求1所述的一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的步骤S4中额定行驶速度的计算方式如下:
轨迹片段通过相邻两个时空点的瞬时速度记作
将上述速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值,其中top为预先设定的参数;
所述的步骤S4中额定行驶加速度的计算方式如下:
将轨迹片段通过相邻三个时空点的瞬时加速度记作将上述加速度值序列按照值从大到小排序,则的值取为排序后的速度值的前top%的平均值;
所述的步骤S4中行驶路程的计算公式如下:
所述的步骤S4中聚集系数匹配的轨迹数,即在拓扑结构图G中对应的顶点的出度。
6.根据权利要求1所述的一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的步骤S4中频数的计算步骤如下:
a、令l=1,
b、计算的最长公共子序列,其计算方式如下:记为轨迹片段的前l1个时空点与轨迹片段的前l2个位置的最长公共子序列的长度,其计算公式如下:
c、若其中,Fb为预先设定好的阈值,其值接近于1,len(·)表示轨迹片段的长度,则令
d、若l=Ep,其中,Ep为用户p的轨迹片段总数,则计算完成,否则令l=l+1,转到步骤b。
7.根据权利要求1所述的一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的步骤S4中判别交通工具类别的规则集定义如下:
规则S401、根据的取值,按如下方案对交通工具类别进行判别:
所属区间为[0,vwalk),则交通工具类别为无交通工具,即步行;
所属区间为[vbike,vlow),则交通工具类别为低速机动车,并转至使用规则S402作进一步判别;
所属区间为[vlow,vmid1),则交通工具类别为摩托车;
所属区间为[vmid1,vmid2),则交通工具类别为各类汽车、地铁或普快列车,并转至使用规则S403作进一步判别;
所属区间为[vmid2,vhigh),则交通工具类别为动车;
则交通工具类别为高铁;
其中,vwalk,vbike,vlow,vmid1,vmid2,vhigh均为预先设定的参数,其取值应满足vwalk<vbike<vlow<vmid1<vmid2<vhigh
规则S402、将路程与位移的比值以及聚集系数两个特征做进一步判别,若其中rateroad为预先设定的参数,则轨迹的交通工具类别为在公路上行驶的低速机动车,否则交通工具类别应当为在非公路上行驶的低速机动车;
其中clutour为预先设定的参数,则轨迹的交通工具类别为载客低速机动车,为非载客低速机动车;
规则S404、若其中stdacccar为预先设定的参数,则轨迹的交通工具类别为货车,反之标记为小轿车;
规则S405、若其中clusub为预先设定的参数,且取值大于clucoach,则轨迹的交通工具类别为市内轨道交通工具,若其中freqbus为预先设定的参数,则轨迹的交通工具类别为公共汽车,若则标记轨迹的交通工具类别为非公共汽车的其他客车;
规则S406、若其中clutrain为预先设定的参数,且取值大于clucoach,则标记轨迹的交通工具类别为普快列车,反之标记轨迹的交通工具类别为长途客车。
8.根据权利要求1所述的一种利用移动通信数据识别交通工具类别的方法,其特征在于,所述的步骤S502中,选取轨迹片段所按照的规则为:
规则(1):在图G中的对应顶点的出度最多,即匹配的轨迹数最多,
若满足规则(1)的轨迹片段不唯一,则应满足规则(2):为满足规则(1)的所有轨迹片段中,行驶路程最长的;
若满足规则(2)的轨迹片段仍然不唯一,则为满足规则(2)的轨迹片段中的任意一个。
CN201811048538.4A 2018-09-10 2018-09-10 一种利用移动通信数据识别交通工具类别的方法 Expired - Fee Related CN109035787B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811048538.4A CN109035787B (zh) 2018-09-10 2018-09-10 一种利用移动通信数据识别交通工具类别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811048538.4A CN109035787B (zh) 2018-09-10 2018-09-10 一种利用移动通信数据识别交通工具类别的方法

Publications (2)

Publication Number Publication Date
CN109035787A true CN109035787A (zh) 2018-12-18
CN109035787B CN109035787B (zh) 2020-07-28

Family

ID=64620580

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811048538.4A Expired - Fee Related CN109035787B (zh) 2018-09-10 2018-09-10 一种利用移动通信数据识别交通工具类别的方法

Country Status (1)

Country Link
CN (1) CN109035787B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111192452A (zh) * 2019-12-27 2020-05-22 东软集团股份有限公司 行程数据分段方法、装置、存储介质和电子设备
CN111310070A (zh) * 2019-12-20 2020-06-19 东软集团股份有限公司 确定频繁行程的方法、装置、存储介质和电子设备
CN111723835A (zh) * 2019-03-21 2020-09-29 北京嘀嘀无限科技发展有限公司 车辆移动轨迹区分方法、装置和电子设备
CN112530166A (zh) * 2020-12-01 2021-03-19 江苏欣网视讯软件技术有限公司 基于信令数据与大数据分析识别公交出行上下车站点的方法与系统
CN112818173A (zh) * 2021-01-21 2021-05-18 浙江大华技术股份有限公司 关联对象的识别方法、装置及计算机可读存储介质
CN114707567A (zh) * 2022-02-08 2022-07-05 高德软件有限公司 轨迹分类方法、轨迹分类模型训练方法及计算机程序产品
CN115022810A (zh) * 2021-03-05 2022-09-06 中国移动通信集团江苏有限公司 基于手机信令数据识别出行方式的方法、装置及电子设备

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002300632A (ja) * 2001-03-29 2002-10-11 Denso Corp 携帯型無線通信装置
CN102611985A (zh) * 2011-01-24 2012-07-25 国际商业机器公司 一种用于提供出行信息的方法和设备
CN102708680A (zh) * 2012-06-06 2012-10-03 北京交通大学 基于agps技术的交通出行方式识别方法
CN105608505A (zh) * 2015-12-22 2016-05-25 重庆邮电大学 一种基于手机信令数据的居民轨道交通出行方式识别方法
CN106197458A (zh) * 2016-08-10 2016-12-07 重庆邮电大学 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法
CN106446208A (zh) * 2016-09-30 2017-02-22 东南大学 一种考虑路网契合度的智能手机出行方式识别方法
US9641639B2 (en) * 2014-06-24 2017-05-02 Google Inc. Dynamic caching during travel
CN107241512A (zh) * 2017-06-30 2017-10-10 清华大学 基于手机数据的城际交通出行方式判断方法和设备
CN107845260A (zh) * 2017-10-26 2018-03-27 杭州东信北邮信息技术有限公司 一种用户公交出行方式的识别方法
CN108171973A (zh) * 2017-12-27 2018-06-15 东南大学 一种基于手机网格数据的交通出行模式识别方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002300632A (ja) * 2001-03-29 2002-10-11 Denso Corp 携帯型無線通信装置
CN102611985A (zh) * 2011-01-24 2012-07-25 国际商业机器公司 一种用于提供出行信息的方法和设备
CN102708680A (zh) * 2012-06-06 2012-10-03 北京交通大学 基于agps技术的交通出行方式识别方法
US9641639B2 (en) * 2014-06-24 2017-05-02 Google Inc. Dynamic caching during travel
CN105608505A (zh) * 2015-12-22 2016-05-25 重庆邮电大学 一种基于手机信令数据的居民轨道交通出行方式识别方法
CN106197458A (zh) * 2016-08-10 2016-12-07 重庆邮电大学 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法
CN106446208A (zh) * 2016-09-30 2017-02-22 东南大学 一种考虑路网契合度的智能手机出行方式识别方法
CN107241512A (zh) * 2017-06-30 2017-10-10 清华大学 基于手机数据的城际交通出行方式判断方法和设备
CN107845260A (zh) * 2017-10-26 2018-03-27 杭州东信北邮信息技术有限公司 一种用户公交出行方式的识别方法
CN108171973A (zh) * 2017-12-27 2018-06-15 东南大学 一种基于手机网格数据的交通出行模式识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
方英兰 等: "基于GPS轨迹的移动用户特征挖掘算法", 《电脑知识与技术》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111723835A (zh) * 2019-03-21 2020-09-29 北京嘀嘀无限科技发展有限公司 车辆移动轨迹区分方法、装置和电子设备
CN111310070A (zh) * 2019-12-20 2020-06-19 东软集团股份有限公司 确定频繁行程的方法、装置、存储介质和电子设备
CN111310070B (zh) * 2019-12-20 2024-03-08 东软集团股份有限公司 确定频繁行程的方法、装置、存储介质和电子设备
CN111192452A (zh) * 2019-12-27 2020-05-22 东软集团股份有限公司 行程数据分段方法、装置、存储介质和电子设备
CN111192452B (zh) * 2019-12-27 2021-06-18 东软集团股份有限公司 行程数据分段方法、装置、存储介质和电子设备
CN112530166A (zh) * 2020-12-01 2021-03-19 江苏欣网视讯软件技术有限公司 基于信令数据与大数据分析识别公交出行上下车站点的方法与系统
CN112530166B (zh) * 2020-12-01 2021-11-05 江苏欣网视讯软件技术有限公司 基于信令数据与大数据分析识别公交出行上下车站点的方法与系统
CN112818173A (zh) * 2021-01-21 2021-05-18 浙江大华技术股份有限公司 关联对象的识别方法、装置及计算机可读存储介质
CN115022810A (zh) * 2021-03-05 2022-09-06 中国移动通信集团江苏有限公司 基于手机信令数据识别出行方式的方法、装置及电子设备
CN114707567A (zh) * 2022-02-08 2022-07-05 高德软件有限公司 轨迹分类方法、轨迹分类模型训练方法及计算机程序产品

Also Published As

Publication number Publication date
CN109035787B (zh) 2020-07-28

Similar Documents

Publication Publication Date Title
CN109035787B (zh) 一种利用移动通信数据识别交通工具类别的方法
CN106197458B (zh) 一种基于手机信令数据和导航路线数据的手机用户出行方式识别方法
CN101965601B (zh) 驾驶辅助装置及驾驶辅助方法
CN111681421B (zh) 基于手机信令数据的对外客运枢纽集疏空间分布分析方法
CN104508719B (zh) 驾驶辅助系统以及驾驶辅助方法
US10373494B1 (en) Method and apparatus for estimating a parking event based on device signal observations
CN104778274B (zh) 基于稀疏出租车gps数据的大范围城市路网旅行时间估计方法
US11710073B2 (en) Method for providing corridor metrics for a corridor of a road network
CN108848460B (zh) 基于rfid和gps数据的人车关联方法
CN107490384B (zh) 一种基于城市路网的最优静态路径选择方法
CN106935027A (zh) 一种基于行驶数据的交通信息预测方法及装置
CN102243811B (zh) 车辆导航系统及推荐路径检索方法
CN108062857B (zh) 用于出租车乘客出行目的的预测方法
CN110310477B (zh) 基于公交gps与手机信令数据的公交客流检测方法
CN110070711A (zh) 一种基于智能网联汽车数据的路段旅行速度区间估计系统和方法
CN106931981A (zh) 一种导航剩余时间的生成方法及装置
CN110298579A (zh) 一种新能源乘用车城市立体工况的构建方法
CN112036757B (zh) 基于手机信令和浮动车数据的停车换乘停车场的选址方法
CN106568456A (zh) 基于gps/北斗定位和云计算平台的不停车收费方法
CN108039046A (zh) 一种基于c-v2x的城市交叉路口行人检测识别系统
CN108806244A (zh) 图像传送装置、方法及非暂态存储介质
CN114898571B (zh) 一种基于etc大数据的高速公路全路段车速测量方法
CN115761920A (zh) 一种基于etc门架数据的车辆轨迹可信提取方法及系统
CN112511971B (zh) 一种基于手机信令数据的出行方式识别方法
CN116933958B (zh) 一种基于刷卡数据的地铁换乘站换乘客流估计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200728

CF01 Termination of patent right due to non-payment of annual fee