CN105160871A - 一种高速公路客车临时上下人识别的方法 - Google Patents
一种高速公路客车临时上下人识别的方法 Download PDFInfo
- Publication number
- CN105160871A CN105160871A CN201510329013.8A CN201510329013A CN105160871A CN 105160871 A CN105160871 A CN 105160871A CN 201510329013 A CN201510329013 A CN 201510329013A CN 105160871 A CN105160871 A CN 105160871A
- Authority
- CN
- China
- Prior art keywords
- highway
- user
- passenger vehicle
- motion track
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种高速公路客车临时上下人识别的方法,首先采集及解析移动通信网络中A接口和Iucs接口的数据,获得用户的通话行为信息,生成用户轨迹信息列表,再综合高速公路沿线基站位置信息挖掘高速公路用户轨迹序列模式并进行匹配,从而识别高速公路用户,还可以基于用户轨迹点驻留时间判断出高速公路用户中的轨迹异常用户,通过比对客车司机的移动轨迹信息,根据轨迹相似度算法,判断出高速公路同一客车用户,实现对高速公路客车临时上下人的识别。该方法基于现网采集的实时数据,根据分析需求进行数据的实时处理与匹配,能够更加有效的进行业务支撑;基于数据建模和完善合理的算法结构,使高速公路客车临时上下人识别更加准确可信。
Description
技术领域
本发明涉及移动通信技术领域,具体涉及一种高速公路客车临时上下人识别的方法。
背景技术
长期以来,高速公路客运车辆临时上下人一直是高速公路交通运输管理部门的管理难点,传统在高速公路上拦截车辆的勤务模式,随机性较强,既不能实现高速公路客车临时上下人的实时监管,又增加了当事人的抵触情绪,如何依据技术手段很好的对高速公路客运车临时上下人模式进行识别,对治理高速公路客车临时上下人的交通隐患,保障公共交通的安全具有重要的意义。
高速公路客车临时上下人的识别技术,重点在于对高速公路客车乘客用户轨迹异常的识别。目前国内针对道路网络空间轨迹异常模式识别的研究较少,对轨迹异常数据的分析最大的挑战是定义能够准确反映数据结构不同的相似度度量。由于路径数据具有序列特征,可以采用序列数据的相似度计算方法。序列数据普遍采用的相似度计算方法主要有结构相似度、编辑距离等。编辑距离定义为从序列s1匹配到s2所需要的操作次数,能较好反映两对序列的全局对齐状况。基于结构相似度的判断,主要从轨迹的位置、方向、转角、速度等维度综合判断,特征属性较好体现了轨迹的结构组成,但高速公路路段特征及行驶车辆动态特征相对单一,在该场景下的应用判断结果差异性不明显。针对序列数据的异常点检测算法有很多:基于序列最长公共子序列的长度作为序列的相似度,并在此基础进行聚类的离群点检测算法,这种方式对路径数据的反映并不准确。
现有的上述方法都不能准确反映路径数据的相似性。目前针对交通数据这些方法在轨迹相似度识别中大多对轨迹中的采样点位置进行分析,无法从全局的角度把握轨迹的特征和运动趋势。轨迹数据不仅仅是传统意义上的按照时间排序的静态点集合,而且是在特定时间与环境下对象的运动路径,在道路网络空间中的如何科学化、自动化的进行异常轨迹行为识别,从而为高速公路智能管理提供支撑,亟需人们去解决、去完善。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种高速公路客车临时上下人识别的方法,通过该方法能够更加准确的识别出高速公路用户,并能够在此基础上进一步识别出高速公路客车用户和客车上的临时上下车用户情况。
为实现上述目的,本发明采用的技术方案如下:
一种高速公路客车临时上下人识别的方法,包括以下步骤:
(1)采集并解析移动通信网络中A接口和IuCS接口的信令数据,获得用户的移动轨迹序列;所述用户的移动轨迹序列是指移动用户在设定时间段内在其经过的路段上的基站位置信息按照时间顺序组成的一个序列;所述基站位置信息包括用户所在的基站位置区编码LAC和基站扇区编码CI;
(2)根据所述用户的移动轨迹序列和选定的高速公路沿线的基站位置分布信息,挖掘得到所述选定的高速公路上的高速公路用户移动轨迹序列模式;
(3)根据所选定的高速公路上的高速公路用户移动轨迹序列模式和用户的移动轨迹序列识别出选定的高速公路上的高速公路用户;
(4)统计高速公路用户在其移动轨迹序列中的各基站位置的驻留时间,判断各基站位置的驻留时间中的异常值,将异常值对应的用户判定为移动异常用户,异常值所对应的基站位置为异常点;
(5)获取所述设定时间段内所述选定的高速公路沿线的客车司机的移动轨迹序列,以客车司机的移动轨迹序列作为参考序列,判断所述移动异常用户在其异常点之前或之后是否为高速公路客车用户,若是,则判断所述移动异常用户为高速公路上的客车异常移动用户;所述客车异常移动用户包括高速公路客车的临时上车用户、临时下车用户和临时换乘用户。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,该方法还可以包括:
(6)以客车司机的移动轨迹序列作为参考序列,识别出高速公路用户中的所有高速公路客车用户。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,步骤(2)中,根据所述用户的移动轨迹序列和选定的高速公路沿线的基站位置分布信息,挖掘得到所述选定的高速公路上的高速公路用户移动轨迹序列模式,包括:
(2-1)获取选定的高速公路沿线的基站位置分布信息,构建高速公路小区基站列表;所述高速公路小区基站列表中包括在与高速公路垂直距离小于设定距离的范围内的基站位置信息,其中,在与高速公路起始段的垂直距离小于第一设定距离的范围内的基站位置信息记为起始段基站位置信息,在与高速公路终止段的垂直距离小于第二设定距离的范围内的基站位置信息记为终止段基站位置信息,所述高速公路起始段是指与高速公路起点距离小于第一设定值的高速公路段,所述高速公路终止段是指与高速公路终点距离小于第二设定值的高速公路段;
(2-2)获取用户的移动轨迹序列中同时含有一个起始段基站位置信息和一个终止段基站位置信息的用户的移动轨迹序列,将这些用户的移动轨迹序列中位于其所含有的起始段基站位置信息和终止段基站位置信息之间的移动轨迹序列组成的集合作为事务数据集,事务数据集中的每个用户的移动轨迹序列为事务数据集中的一项事务;
(2-3)挖掘所述事务数据集的最大频繁项集,将所述最大频繁项集确定为高速公路用户的轨迹序列模式。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,步骤(3)中,根据所选定的高速公路上的高速公路用户移动轨迹序列模式和用户的移动轨迹序列识别出选定的高速公路上的高速公路用户,包括:
计算用户的移动轨迹序列与高速公路用户的轨迹序列模式的公共序列长度Length,判断公共序列长度Length是否大于第一设定阈值,若是,则判定用户为高速公路用户,若否,则判定用户不是高速公路用户。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,步骤(4)中,判断各基站位置的驻留时间中的异常值的方式为:
统计所有高速公路用户在其移动轨迹序列中的各基站位置的驻留时间,将所有驻留时间作为原始数据集,采用格拉布斯检验法判断出原始数据集中的异常值。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,步骤(4)中,在获取高速公路用户在其移动轨迹序列中的各基站位置的驻留时间之前,还包括:
剔除高速公路用户的移动轨迹序列中客车经停站位置处所对应的基站位置信息。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,步骤(5)中,以客车司机的移动轨迹序列作为参考序列,判断所述移动异常用户在其异常点之前是否为高速公路客车用户,包括:
判断移动异常用户的移动轨迹序列中在其异常点之前的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度是否大于或等于第二设定阈值,若是,则判断移动异常用户在其异常点之前为与客车司机在同一客车上的高速公路客车用户;
以客车司机的移动轨迹序列作为参考序列,判断所述移动异常用户在其异常点之后是否为高速公路客车用户,包括:
判断移动异常用户的移动轨迹序列中在其异常点之后的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度是否大于或等于第二设定阈值,若是,则判断移动异常用户在其异常点之后为与客车司机在同一客车上的高速公路客车用户。
移动异常用户的异常点之前的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度的计算方式为:
假设某一移动异常用户的异常点之前的移动轨迹序列为S1,某一客车司机的移动轨迹序列为S2,S1与S2的迹相似度ESIM(S1,S1)的计算公式为:
ESIM(S1,S2)=1-Normalized(EDIST(S1,S2))
=1-EDIST(S1,S2)/[EDIST(S1,S2)+SE(S1,S2)]
EDIST=|S1|+|S2|-2|(S1,S2)|
SE(S1,S2)=[|S1|+|S2|-EDIST(S1,S2)]/2
其中,EDIST(S1,S2)表示S1与S2的编辑距离,Normalized(EDIST(S1,S2))表示归一化后的编辑距离,SE(S1,S1)表示S1与S2的编辑相似度,|S1|与|S2|分别表示序列S1与S2的长度,|(S1,S2)|表示序列S1与S2的共有序列长度。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,步骤(6)中,以客车司机的移动轨迹序列作为参考序列,识别出高速公路用户中的高速公路客车用户,包括:
计算高速公路用户的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度,将轨迹相似度大于或等于第二设定阈值的用户判断为与客车司机在同一客车上的高速公路客车用户。
进一步,如上所述的一种高速公路客车临时上下人识别的方法,步骤(5)中,如果移动异常用户仅在其异常点之前为高速公路客车用户,则判断移动异常用户为高速公路客车的临时下车用户;
如果移动异常用户仅在其异常点之后为高速公路客车用户,则判断移动异常用户为高速公路客车的临时上车用户;
如果移动异常用户在其异常点之前和之后均是高速公路客车用户、且之前和之后为不同客车上的高速公路客车用户,则判断移动异常用户为高速公路客车的临时换乘用户。
本发明的有益效果在于:
1)基于现网采集的实时数据,采用基站定位技术,能够准确的定位出用户的位置,识别出高速公路用户;
2)能够以高速公路客车司机的移动轨迹序列为参考,识别出高速公路用户中的客车用户,并能够根据高速公路客车用户的移动轨迹序列和司机的移动轨迹序列的编辑距离的计算,实现对高速公路客车用户的轨迹的识别,判断出高速公路上的临时上下车用户,为高速公路上上下车问题的监控提供了义务支持,具有良好的使用意义。
附图说明
图1为本发明具体实施方式中一种高速公路客车临时上下人识别的方法的流程图;
图2为具体实施方式中高速公路沿线基站小区基站列表中所选取的基站位置的示意图。
具体实施方式
下面结合说明书附图与具体实施方式对本发明做进一步的详细说明。
图1示出了本发明具体实施方式中一种高速公路客车临时上下人识别的方法的流程图,由图中可以看出,该方法主要可以包括以下几个步骤:
步骤S100:采集并解析移动通信网络中A接口和IuCS接口的信令数据,获得用户的移动轨迹序列;
本实施方式中所提供的高速公路用户识别方法是通过采集移动通信网络中A接口和IuCS接口中的信令数据进行的。
A接口为网络子系统(NSS)与基站子系统(BSS)间的通信接口。从系统上来讲,就是移动交换中心(MSC)与基站控制器(BSC)之间的接口。此接口传递的信息包括移动台管理、基站管理、移动性管理、接续管理等。IuCS接口在3G网络、无线网络控制器RAN、核心网CN的通信接口中称为Iu接口,是RNC和CN的MSCserver之间的接口,主要用来是处理CS域信令和业务数据的传输。
因此,通过A接口和IuCS接口的信令采集与解码合成能够获得用户在网络中的很多通话行为信息(包括用户标识、终端事件类型及用户所在的基站位置信息等),得到用户的呼叫详单记录CDR,典型的CDR可获得的信息如下表所示:
在获得用户的通话行为信息后,根据这些通话行为信息得到用户的移动轨迹序列。本实施方式中,所述用户的移动轨迹序列是指移动用户在设定时间段内在其经过的高速公路路段上的基站位置信息按照时间顺序组成的一个序列。
本实施方式中,所述基站位置信息包括用户所在的基站位置区编码LAC和基站扇区编码CI(即小区编码)。通过用户所在的基站位置信息(LAC,CI)来近似标记用户的位置,在实际应用中,可以采用一些算法将用户所在的基站位置信息映射成高速公路上的具体位置。
可见,用户的移动轨迹序列是将用户在设定时间段内经过的基站位置按照时间先后顺序排列后的一个序列,当然,每个用户的用户标识与其移动轨迹序列是唯一对应的。在实际应用中,可以将用户的移动轨迹序列、经过某一基站位置的时刻和用户标识记录在一个数组中,通过该数组中的数据唯一对应一个用户的移动轨迹。
本实施方式中,将采集解析得到的用户的移动轨迹序列作为一个序列数据库,该数据库作为后续挖掘高速公路用户序列模式的基础数据。其中,所述用户标识可以是用户唯一的国际移动用户识别码IMSI,也可以是设定的能够唯一标识用户的用户ID。所述移动终端用户包括但不限于手机用户、pad用户等。
例如,在实际应用中,设用户编码即用户标识为CID,用户在Tj时刻运动位置(Location)为Lj,其中Lj由描述用户位置的LAC、CI构成,即可以表示为Lj=(LACj,CIj)。本实施方式中,用来标记用户位置的基站位置信息一般是取高速公路沿线的、与高速公路垂直距离在设定距离范围内的小区基站,或者是利用专用无线网络覆盖测试设备收集到的高速公路沿线的覆盖小区基站。此时,用户的移动轨迹数据可用三元组<CID,T,L>表示,CID为用户标识、T为移动时间、L为基站位置信息,用户在设定时间段内的每个不同时间点T都对应一个L,设定时间段内的所有L按照时间T的先后排序即使用户的移动轨迹序列S(sequence),此时,三元组<CID,T,L>转化成二元组<CID,S>集合。其中,在设定时间段内,选取哪些时间点的用户轨迹数据是可设置的。
本实施方式中,采集得到的所有用户的移动轨迹数据<CID,T,L>的集合可以记为事务数据库D_Transaction,所有用户二元组<CID,S>的集合记为序列数据库D_Sequence。如下表所示:表一是事务数据库D_Transaction示例,右表是序列数据库D_Sequence示例。CID的数值用以区分用户,T的数值用以区分时间先后顺序,L的数值表示某个具体的位置(即(LACj,CIj)),S的取值表示位置的序列。如对于用户标识CID为1的用户,其在时间为1的时刻对应的基站位置信息为a,在2时刻对应的基站位置信息为b,在3时刻对应的基站位置信息为c,那么其在这段时间内的移动轨迹序列S即为abc。
步骤S200:根据用户移动轨迹序列和高速公路沿线的基站位置分布信息,得到高速公路用户的移动轨迹序列模式;
本实施方式中,高速公路沿线的基站位置分布信息主要是取高速公路沿线、在与高速公路垂直截距距离在设定距离范围内的小区基站信息,也可以是利用专用无线网络覆盖测试设备收集到的高速公路沿线覆盖小区基站的信息。如图2所示,图中实线表示高速公路,h为所述设定距离,高速公路两侧与高速公路的垂直距离小于或等于h的范围为本实施方式中选取基站的区域,即图中最外围的虚线所围成的区域,该区域的基站位置信息按照公路的走向即可以得到高速公路沿线的基站位置分布信息列表。所述高速公路沿线的基站位置分布信息同样包括基站位置区编码LAC和基站扇区编码CI。
得到用户的移动轨迹序列和高速公路沿线的基站位置分布信息后,便可以根据这些信息挖掘得到高速公路用户的移动轨迹序列模式。高速公路用户的移动轨迹序列模式挖掘的目的是在步骤S100得到的序列数据库的基础上,结合高速公路沿线的基站位置分布信息,得到一个高速公路用户的序列模式,从而可以通过判断用户的移动轨迹序列是否符合该序列模式来判断出用户会否为高速公路用户。
本实施方式中,根据用户移动轨迹序列和高速公路沿线的基站位置分布信息,得到所述选定的高速公路上的高速公路用户移动轨迹序列模式的具体步骤包括:
1)获取选定的高速公路沿线的基站位置分布信息,构建高速公路小区基站列表;由前文描述可知,所述高速公路小区基站列表中包括在与高速公路垂直距离小于设定距离的范围内的基站位置信息,其中,本实施方式中,在与高速公路起始段的垂直距离小于第一设定距离的范围内的基站位置信息记为起始段基站位置信息,在与高速公路终止段的垂直距离小于第二设定距离的范围内的基站位置信息记为终止段基站位置信息,所述高速公路起始段是指与高速公路起点距离小于第一设定值的高速公路段,所述高速公路终止段是指与高速公路终点距离小于第二设定值的高速公路段;如图2所示,假设公路的走向为由右到左,则右侧的两条纵向曲线与两条横线曲线之间的范围内的基站位置信息即为起始段基站位置信息,左侧的两条纵向曲线与两条横线曲线之间的范围内的基站位置信息即为终止段基站位置信息;
2)获取用户的移动轨迹序列中同时含有一个起始段基站位置信息和一个终止段基站位置信息的用户的移动轨迹序列,将这些用户的移动轨迹序列中位于其所含有的起始段基站位置信息和终止段基站位置信息之间的移动轨迹序列组成的集合作为事务数据集,事务数据集中的每个用户的移动轨迹序列为事务数据集中的一项事务;
3)挖掘所述事务数据集的最大频繁项集,将所述最大频繁项集确定为高速公路用户的轨迹序列。
本实施方式中,首先定义一个支持度的概念:如果序列a是元组<CID,S>中S的子序列,则称元组<CID,S>包含序列a,数据库D_Sequence中包含a的元组个数称为序列a在该数据库中的支持数,记为support(a),a在该数据库中的支持数占数据库中所有元组数的比例称为支持度,记为sup(a),支持度是一个介于0-1之间的数,给定一个正小数min_sup称为最小支持度阈值。如果序列a在数据库中支持度满足sup(a)≥min_sup则称a是频繁项。
在本实施方式中,在参考高速公路沿线基站位置分布信息构建的高速公路小区基站列表时,高速公路起始段基站位置信息的集合记为HighWay_S,终止段基站位置信息的集合记为HighWay_F,在挖掘高速公路用户的轨迹序列时,首先提取出步骤S100中得到的用户移动轨迹序列中同时包含HighWay_S与HighWay_F子项的用户数据,截取用户数据中在HighWay_S首次出现为起点,在HighWay_F中最后出现为终点的数据段构成的数据集,作为事务数据集,记为D_Highway,以D_Highway为预处理数据,设置最小支持度阈值min_sup,分析计算高速公路用户的轨迹序列模式,具体步骤包括:
a)首先扫描数据集D_Highway,计算数据集中所有单个项的支持度,它们称作候选1-项集,记作C1。
b)然后,选择支持度大于或等于min_sup的项,这些被称为频繁1-项集,并记作List1。
c)同法,在List1基础上,计算List1中所有单个项的支持度,产生它们作为候选2-项集,记作C2(2-项集指的生成的子集中有两个1-项集);
d)然后,再选择支持度大于或等于min_sup的项,这些被称为频繁2-项集,并记作List2;
e)重复上述过程,直到不再有候选(或频繁)项集为止,即找到最大频繁项集;
f)这样,该过程形如C1→List1→C2→List2→…Listk
Listk即为序列数据集D_Highway的序列模式(高速公路用户的轨迹序列模式)。
步骤S300:根据所选定的高速公路上的高速公路用户移动轨迹序列模式和用户的移动轨迹序列识别出选定的高速公路上的高速公路用户;
本实施方式中,该步骤实现的具体方式为:
计算待识别的用户的移动轨迹序列与高速公路用户的轨迹序列模式的公共序列长度Length,判断公共序列长度Length是否大于第二设定阈值δ,若是则判定用户为高速公路用户,否则判定用户不是高速公路用户。
该步骤通过判断用户的移动轨迹序列中和高速公路用户轨迹序列模式中所共同包含的公共序列长度即共同包含的基站位置信息的个数是否大于设定阈值,实现了用户中高速公路用户的识别,本实施方式中,将所有高速公路用户的移动轨迹序列组成的集合记为高速公路用户数据集User_Highway。
步骤S400:判断高速公路用户中的移动异常用户;
该步骤中,统计高速公路用户在其移动轨迹序列中的各基站位置的驻留时间,判断各基站位置的驻留时间中的异常值,将异常值对应的用户判定为移动异常用户,异常值所对应的基站位置为异常点。本实施方式中,该步骤通过统计所有高速公路用户在其移动轨迹序列中的各基站位置的驻留时间,将所有驻留时间作为原始数据集,采用格拉布斯检验法判断出原始数据集中的异常值。
通过该步骤,可以判断出高速公路用户中在高速公路上驻留时间异常的用户,这些用户很有可能就是在高速公路上临时上、下车或换乘的用户。在实际应用中,考虑到高速公路休息区用户的驻留行为,为减小对用户单点位置驻留时间异常值判断的误差,在判断驻留时间异常用户时,首先需要对高速公路休息区用户数据进行剔除,具体剔除方式为:
指定高速路段的运营车辆经停站(含休息区)所在的基站位置点的集合HighWay_R,剔除预处理用户数据集D_Highway含HighWay_R子项的数据,以剔除了HighWay_R子项的数据的高速公路用户数据集作为该步骤判断驻留时间异常用户的数据基础。
本实施方式中,以高速公路用户的移动轨迹序列中所包含的基站位置信息为维度,采用现有的格拉布斯检验法判断各基站位置信息的驻留时间中的异常值。具体实现步骤如下:
设用户在某一基站位置L点驻留的起始时间点为Ts,结束时间点为Te,则驻留时间TL=Te-Ts;将所有高速公路用户在L点的驻留时间记录在二维数据<TL,L>集合中,以L为维度,采用格拉布斯检验法分析二维数据<TL,L>集合中TL异常的数据。
一组测量数据中,如果个别值偏离平均值比较远,则将此测量值称之为“可疑值”。用统计方法如格拉布斯准则进行判断,先将数据按L维度以TL为指标从小到大排列,统计临界系数G(L,n)的值为G0,然后分别计算出G1、Gn;
然后计算平均值、残差和标准差,平均值残差方差i是驻留时间的序列号码);
查格拉布斯表获得临界值G0;
统计量Gi,Gi=VLi/STL:
若Gn>G0,则序列号码n对应的驻留时间为异常值;
若Gn<G0,则L点不存在异常用户;
然后用剩下的测量值重新计算平均值、标准偏差、G1、Gn和G0,重复上述步骤继续进行判断,依此类推。获取TL异常的用户记为User_Updown,异常用户数据构成数据集D_Updown。
步骤S500:获取所述设定时间段内所述选定的高速公路沿线的客车司机的移动轨迹序列,以客车司机的移动轨迹序列作为参考序列,识别出高速公路用户中的高速公路客车用户;
在步骤S300中高速公路用户的判别之后,本实施方式中,以客车司机的移动轨迹序列作为参考序列,可以判断出高速公路用户中的高速公路客车用户,具体步骤包括:
计算高速公路用户的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度,将轨迹相似度大于或等于第二设定阈值的用户判断为与客车司机在同一客车上的高速公路客车用户;轨迹相似度的计算方式为:
假设用户的移动轨迹序列为Si,客车司机的移动轨迹序列为Sj,Si与Sj的轨迹相似度ESIM(Si,Sj)的计算公式为:
ESIM(Si,Sj)=1-Normalized(EDIST(Si,Sj))
=1-EDIST(Si,Sj)/[EDIST(Si,Sj)+SE(Si,Sj)]
EDIST=|Si|+|Sj|-2|(Si,Sj)|
SE(Si,Sj)=[|Si|+|Sj|-EDIST(Si,Sj)]/2
其中,EDIST(Si,Sj)表示Si与Sj的编辑距离,Normalized(EDIST(Si,Sj))表示归一化后的编辑距离,SE(Si,Sj)表示Si与Sj的编辑相似度,|Si|与|Sj|分别表示序列Si与Sj的长度,|(Si,Sj)|表示序列Si与Sj的共有序列长度。
本实施方式中,基于高速公路用户的移动轨迹序列与高速公路客车司机的移动轨迹序列之间的编辑距离(编辑距离定义为从一个序列变换到另一个序列所需要的最少的插入、删除和替换操作代价的总和),计算出两者的轨迹相似度,并根据计算出的轨迹相似度是否大于设定阈值,来识别出其中的高速公路客车用户。在计算时,由于计算2个序列之间的编辑距离所给出的结果是个绝对数值,因此在分析长度变化范围较大的序列时,就很容易使长序列之间的距离远远大于短序列之间距离,这对高速公路场景应用来说,显然是不合理的,因此,本实施方式中,通过对编辑距离进行归一化,可有效规避这一不合理因素。
步骤S600:判断所述移动异常用户中的客车异常移动用户,包括临时上车用户、临时下车用户和临时换乘用户。
判断步骤S400中识别出的移动异常用户在其异常点之前或之后是否为高速公路客车用户,若是,则判断所述移动异常用户为高速公路上的客车异常移动用户;所述客车异常移动用户包括高速公路客车的临时上车用户、临时下车用户和临时换乘用户。
其中,移动异常用户在其异常点之前或之后是否为高速公路客车用户的判断方法与步骤S500中判断高速公路客车用户的方法是相同,具体的:
判断移动异常用户的移动轨迹序列中在其异常点之前的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度是否大于或等于第二设定阈值,若是,则判断移动异常用户在其异常点之前为与客车司机在同一客车上的高速公路客车用户;
以客车司机的移动轨迹序列作为参考序列,判断所述移动异常用户在其异常点之后是否为高速公路客车用户,包括:
判断移动异常用户的移动轨迹序列中在其异常点之后的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度是否大于或等于第二设定阈值,若是,则判断移动异常用户在其异常点之后为与客车司机在同一客车上的高速公路客车用户。
移动异常用户的异常点之前的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度的计算方式为:
假设某一移动异常用户的异常点之前的移动轨迹序列为S1,某一客车司机的移动轨迹序列为S2,S1与S2的迹相似度ESIM(S1,S1)的计算公式为:
ESIM(S1,S2)=1-Normalized(EDIST(S1,S2))
=1-EDIST(S1,S2)/[EDIST(S1,S2)+SE(S1,S2)]
EDIST=|S1|+|S2|-2|(S1,S2)|
SE(S1,S2)=[|S1|+|S2|-EDIST(S1,S2)]/2
其中,EDIST(S1,S2)表示S1与S2的编辑距离,Normalized(EDIST(S1,S2))表示归一化后的编辑距离,SE(S1,S1)表示S1与S2的编辑相似度,|S1|与|S2|分别表示序列S1与S2的长度,|(S1,S2)|表示序列S1与S2的共有序列长度。
本实施方式中,判断移动异常用户为高速公路上的客车异常移动用户,具体包括:
如果移动异常用户仅在其异常点之前为高速公路客车用户,则判断移动异常用户为高速公路客车的临时下车用户;
如果移动异常用户仅在其异常点之后为高速公路客车用户,则判断移动异常用户为高速公路客车的临时上车用户;
如果移动异常用户在其异常点之前和之后均是高速公路客车用户、且之前和之后为不同客车上的高速公路客车用户,则判断移动异常用户为高速公路客车的临时换乘用户。
通过该步骤,即可以判断出在高速公路上临时上车、下车或转车的高速公路客车用户,实现了高速公路上临时上下车人的识别。
需要说明的是,本实施方式中图1中所示的一种高速公路客车临时上下人识别的方法只是本发明所提供的方法的一种具体实施方式,并不是唯一的一种方式。例如,步骤S500与步骤S600并没有固定的前后顺序,步骤S100-S300以及步骤S500的组合即能够实现高速公路上客车用户的识别,步骤S100-S300以及步骤S600的组合即能够实现高速公路客车用户的移动异常用户的识别。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体与另一个实体区分开来,这些实体之间实际并不存在任何的关系或者顺序。本实施方式中,上述的第一设定值、第二设定值、第一设定阈值和第二设定阈值等均是经验值。
本发明所述的方法,基于网络A接口、Iucs接口信令数据,可以全天候的采集海量用户的位置信息,采用基站定位技术,能够准确地定位用户的位置,清楚地指出用户所处区域,为高速公路上下车问题监控提供了方便。且该方法基于编辑距离的方法对轨迹匹配程度进行研判,可对轨迹进行有效划分,分析效果及功能扩展性更好,具有良好的实用意义。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (9)
1.一种高速公路客车临时上下人识别的方法,包括以下步骤:
(1)采集并解析移动通信网络中A接口和IuCS接口的信令数据,获得用户的移动轨迹序列;所述用户的移动轨迹序列是指移动用户在设定时间段内在其经过的路段上的基站位置信息按照时间顺序组成的一个序列;所述基站位置信息包括用户所在的基站位置区编码LAC和基站扇区编码CI;
(2)根据所述用户的移动轨迹序列和选定的高速公路沿线的基站位置分布信息,挖掘得到所述选定的高速公路上的高速公路用户移动轨迹序列模式;
(3)根据所选定的高速公路上的高速公路用户移动轨迹序列模式和用户的移动轨迹序列识别出选定的高速公路上的高速公路用户;
(4)统计高速公路用户在其移动轨迹序列中的各基站位置的驻留时间,判断各基站位置的驻留时间中的异常值,将异常值对应的用户判定为移动异常用户,异常值所对应的基站位置为异常点;
(5)获取所述设定时间段内所述选定的高速公路沿线的客车司机的移动轨迹序列,以客车司机的移动轨迹序列作为参考序列,判断所述移动异常用户在其异常点之前或之后是否为高速公路客车用户,若是,则判断所述移动异常用户为高速公路上的客车异常移动用户;所述客车异常移动用户包括高速公路客车的临时上车用户、临时下车用户和临时换乘用户。
2.根据权利要求1所述的一种高速公路客车临时上下人识别的方法,其特征在于:该方法还可以包括:
(6)以客车司机的移动轨迹序列作为参考序列,识别出高速公路用户中的所有高速公路客车用户。
3.根据权利要求1或2所述的一种高速公路客车临时上下人识别的方法,其特征在于:步骤(2)中,根据所述用户的移动轨迹序列和选定的高速公路沿线的基站位置分布信息,挖掘得到所述选定的高速公路上的高速公路用户移动轨迹序列模式,包括:
(2-1)获取选定的高速公路沿线的基站位置分布信息,构建高速公路小区基站列表;所述高速公路小区基站列表中包括在与高速公路垂直距离小于设定距离的范围内的基站位置信息,其中,在与高速公路起始段的垂直距离小于第一设定距离的范围内的基站位置信息记为起始段基站位置信息,在与高速公路终止段的垂直距离小于第二设定距离的范围内的基站位置信息记为终止段基站位置信息,所述高速公路起始段是指与高速公路起点距离小于第一设定值的高速公路段,所述高速公路终止段是指与高速公路终点距离小于第二设定值的高速公路段;
(2-2)获取用户的移动轨迹序列中同时含有一个起始段基站位置信息和一个终止段基站位置信息的用户的移动轨迹序列,将这些用户的移动轨迹序列中位于其所含有的起始段基站位置信息和终止段基站位置信息之间的移动轨迹序列组成的集合作为事务数据集,事务数据集中的每个用户的移动轨迹序列为事务数据集中的一项事务;
(2-3)挖掘所述事务数据集的最大频繁项集,将所述最大频繁项集确定为高速公路用户的轨迹序列模式。
4.根据权利要求1或2所述到的一种高速公路客车临时上下人识别的方法,其特征在于:步骤(3)中,根据所选定的高速公路上的高速公路用户移动轨迹序列模式和用户的移动轨迹序列识别出选定的高速公路上的高速公路用户,包括:
计算用户的移动轨迹序列与高速公路用户的轨迹序列模式的公共序列长度Length,判断公共序列长度Length是否大于第一设定阈值,若是,则判定用户为高速公路用户,若否,则判定用户不是高速公路用户。
5.根据权利要求1所述的一种高速公路客车临时上下人识别的方法,其特征在于:步骤(4)中,判断各基站位置的驻留时间中的异常值的方式为:
统计所有高速公路用户在其移动轨迹序列中的各基站位置的驻留时间,将所有驻留时间作为原始数据集,采用格拉布斯检验法判断出原始数据集中的异常值。
6.根据权利要求1或5所述的一种高速公路客车临时上下人识别的方法,其特征在于:步骤(4)中,在获取高速公路用户在其移动轨迹序列中的各基站位置的驻留时间之前,还包括:
剔除高速公路用户的移动轨迹序列中客车经停站位置处所对应的基站位置信息。
7.根据权利要求2所述的一种高速公路客车临时上下人识别的方法,其特征在于:步骤(5)中,以客车司机的移动轨迹序列作为参考序列,判断所述移动异常用户在其异常点之前是否为高速公路客车用户,包括:
判断移动异常用户的移动轨迹序列中在其异常点之前的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度是否大于或等于第二设定阈值,若是,则判断移动异常用户在其异常点之前为与客车司机在同一客车上的高速公路客车用户;
以客车司机的移动轨迹序列作为参考序列,判断所述移动异常用户在其异常点之后是否为高速公路客车用户,包括:
判断移动异常用户的移动轨迹序列中在其异常点之后的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度是否大于或等于第二设定阈值,若是,则判断移动异常用户在其异常点之后为与客车司机在同一客车上的高速公路客车用户。
移动异常用户的异常点之前的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度的计算方式为:
假设某一移动异常用户的异常点之前的移动轨迹序列为S1,某一客车司机的移动轨迹序列为S2,S1与S2的迹相似度ESIM(S1,S1)的计算公式为:
ESIM(S1,S2)=1-Normalized(EDIST(S1,S2))
=1-EDIST(S1,S2)/[EDIST(S1,S2)+SE(S1,S2)]
EDIST=|S1|+|S2|-2|(S1,S2)|
SE(S1,S2)=[|S1|+|S2|-EDIST(S1,S2)]/2
其中,EDIST(S1,S2)表示S1与S2的编辑距离,Normalized(EDIST(S1,S2))表示归一化后的编辑距离,SE(S1,S1)表示S1与S2的编辑相似度,|S1|与|S2|分别表示序列S1与S2的长度,|(S1,S2)|表示序列S1与S2的共有序列长度。
8.根据权利要求7所述的一种高速公路客车临时上下人识别的方法,其特征在于:步骤(6)中,以客车司机的移动轨迹序列作为参考序列,识别出高速公路用户中的高速公路客车用户,包括:
计算高速公路用户的移动轨迹序列与客车司机的移动轨迹序列的轨迹相似度,将轨迹相似度大于或等于第二设定阈值的用户判断为与客车司机在同一客车上的高速公路客车用户。
9.根据权利要求1或7所述的一种高速公路客车临时上下人识别的方法,其特征在于:步骤(5)中,如果移动异常用户仅在其异常点之前为高速公路客车用户,则判断移动异常用户为高速公路客车的临时下车用户;
如果移动异常用户仅在其异常点之后为高速公路客车用户,则判断移动异常用户为高速公路客车的临时上车用户;
如果移动异常用户在其异常点之前和之后均是高速公路客车用户、且之前和之后为不同客车上的高速公路客车用户,则判断移动异常用户为高速公路客车的临时换乘用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510329013.8A CN105160871B (zh) | 2015-06-15 | 2015-06-15 | 一种高速公路客车临时上下人识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510329013.8A CN105160871B (zh) | 2015-06-15 | 2015-06-15 | 一种高速公路客车临时上下人识别的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105160871A true CN105160871A (zh) | 2015-12-16 |
CN105160871B CN105160871B (zh) | 2017-10-24 |
Family
ID=54801709
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510329013.8A Active CN105160871B (zh) | 2015-06-15 | 2015-06-15 | 一种高速公路客车临时上下人识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105160871B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106101999A (zh) * | 2016-05-27 | 2016-11-09 | 广州杰赛科技股份有限公司 | 一种用户轨迹的识别方法及装置 |
CN106251629A (zh) * | 2016-09-30 | 2016-12-21 | 福建工程学院 | 识别公交车司机与乘客的方法及系统 |
CN106327595A (zh) * | 2016-08-26 | 2017-01-11 | 北京小米移动软件有限公司 | 打车计费的方法及装置 |
CN106341461A (zh) * | 2016-08-26 | 2017-01-18 | 北京小米移动软件有限公司 | 支付打车费用的方法及装置 |
CN106921940A (zh) * | 2015-12-28 | 2017-07-04 | 宁波普天通信技术有限公司 | 同轨迹用户查找方法及装置和同行用户查找方法及装置 |
CN108122414A (zh) * | 2016-11-30 | 2018-06-05 | 杭州海康威视数字技术股份有限公司 | 公路上客车上下客的检测方法及装置 |
CN110021169A (zh) * | 2019-05-06 | 2019-07-16 | 南京航空航天大学 | 一种基于手机信令数据和公交数据的公交乘客下车站点推测方法 |
CN110708673A (zh) * | 2019-10-16 | 2020-01-17 | 杭州云深科技有限公司 | 一种位置确定方法和便捷式多功能设备 |
CN112182132A (zh) * | 2020-09-28 | 2021-01-05 | 北京红山信息科技研究院有限公司 | 一种地铁用户的识别方法、系统、设备和存储介质 |
CN113556697A (zh) * | 2021-07-21 | 2021-10-26 | 智慧足迹数据科技有限公司 | 基于手机信令的快递员识别方法及相关装置 |
CN114529348A (zh) * | 2022-02-22 | 2022-05-24 | 携程旅游网络技术(上海)有限公司 | 车辆行驶路径计费方法、系统、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110060600A1 (en) * | 2009-09-10 | 2011-03-10 | Transittix, Llc | Systems and Methods For Tracking the Transportation of Passengers |
CN103052022A (zh) * | 2011-10-17 | 2013-04-17 | 中国移动通信集团公司 | 基于移动行为的用户稳定点发现方法和系统 |
CN202887447U (zh) * | 2012-09-18 | 2013-04-17 | 尹蓉生 | 高速公路车辆安全运行监管系统 |
CN103841576A (zh) * | 2012-11-20 | 2014-06-04 | 中国移动通信集团浙江有限公司 | 高速铁路用户分离方法、系统及信令数据处理方法和系统 |
CN104361746A (zh) * | 2014-11-05 | 2015-02-18 | 上海新炬网络信息技术有限公司 | 一种高速公路智能交通路况监控方法 |
CN104599496A (zh) * | 2013-10-31 | 2015-05-06 | 大连智友软件科技有限公司 | 一种基于gps定位的智能乘客管理方法 |
-
2015
- 2015-06-15 CN CN201510329013.8A patent/CN105160871B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110060600A1 (en) * | 2009-09-10 | 2011-03-10 | Transittix, Llc | Systems and Methods For Tracking the Transportation of Passengers |
CN103052022A (zh) * | 2011-10-17 | 2013-04-17 | 中国移动通信集团公司 | 基于移动行为的用户稳定点发现方法和系统 |
CN202887447U (zh) * | 2012-09-18 | 2013-04-17 | 尹蓉生 | 高速公路车辆安全运行监管系统 |
CN103841576A (zh) * | 2012-11-20 | 2014-06-04 | 中国移动通信集团浙江有限公司 | 高速铁路用户分离方法、系统及信令数据处理方法和系统 |
CN104599496A (zh) * | 2013-10-31 | 2015-05-06 | 大连智友软件科技有限公司 | 一种基于gps定位的智能乘客管理方法 |
CN104361746A (zh) * | 2014-11-05 | 2015-02-18 | 上海新炬网络信息技术有限公司 | 一种高速公路智能交通路况监控方法 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106921940A (zh) * | 2015-12-28 | 2017-07-04 | 宁波普天通信技术有限公司 | 同轨迹用户查找方法及装置和同行用户查找方法及装置 |
CN106101999A (zh) * | 2016-05-27 | 2016-11-09 | 广州杰赛科技股份有限公司 | 一种用户轨迹的识别方法及装置 |
CN106327595A (zh) * | 2016-08-26 | 2017-01-11 | 北京小米移动软件有限公司 | 打车计费的方法及装置 |
CN106341461A (zh) * | 2016-08-26 | 2017-01-18 | 北京小米移动软件有限公司 | 支付打车费用的方法及装置 |
CN106327595B (zh) * | 2016-08-26 | 2018-10-26 | 北京小米移动软件有限公司 | 打车计费的方法及装置 |
CN106341461B (zh) * | 2016-08-26 | 2019-07-09 | 北京小米移动软件有限公司 | 支付打车费用的方法及装置 |
CN106251629B (zh) * | 2016-09-30 | 2019-07-16 | 福建工程学院 | 识别公交车司机与乘客的方法及系统 |
CN106251629A (zh) * | 2016-09-30 | 2016-12-21 | 福建工程学院 | 识别公交车司机与乘客的方法及系统 |
CN108122414A (zh) * | 2016-11-30 | 2018-06-05 | 杭州海康威视数字技术股份有限公司 | 公路上客车上下客的检测方法及装置 |
CN110021169A (zh) * | 2019-05-06 | 2019-07-16 | 南京航空航天大学 | 一种基于手机信令数据和公交数据的公交乘客下车站点推测方法 |
CN110708673A (zh) * | 2019-10-16 | 2020-01-17 | 杭州云深科技有限公司 | 一种位置确定方法和便捷式多功能设备 |
CN112182132A (zh) * | 2020-09-28 | 2021-01-05 | 北京红山信息科技研究院有限公司 | 一种地铁用户的识别方法、系统、设备和存储介质 |
CN112182132B (zh) * | 2020-09-28 | 2024-03-26 | 北京红山信息科技研究院有限公司 | 一种地铁用户的识别方法、系统、设备和存储介质 |
CN113556697A (zh) * | 2021-07-21 | 2021-10-26 | 智慧足迹数据科技有限公司 | 基于手机信令的快递员识别方法及相关装置 |
CN114529348A (zh) * | 2022-02-22 | 2022-05-24 | 携程旅游网络技术(上海)有限公司 | 车辆行驶路径计费方法、系统、设备及存储介质 |
CN114529348B (zh) * | 2022-02-22 | 2024-07-09 | 携程旅游网络技术(上海)有限公司 | 车辆行驶路径计费方法、系统、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN105160871B (zh) | 2017-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105160871A (zh) | 一种高速公路客车临时上下人识别的方法 | |
CN107305590B (zh) | 一种基于手机信令数据的城市交通出行特征确定方法 | |
CN106912015B (zh) | 一种基于移动网络数据的人员出行链识别方法 | |
CN102521973B (zh) | 一种手机切换定位的道路匹配方法 | |
EP3242236B1 (en) | Transaction risk detection method and device | |
KR101385928B1 (ko) | 교통 관리를 위한 방법 및 장치 | |
CN106323301A (zh) | 一种道路情报的获取方法及装置 | |
CN106778876A (zh) | 基于移动用户轨迹相似性的用户分类方法和系统 | |
CN107888877A (zh) | 车辆追踪及道路交通信息采集的方法及其系统 | |
CN110472999B (zh) | 基于地铁和共享单车数据的客流模式分析方法及装置 | |
CN104902438B (zh) | 一种基于移动通信终端分析客流特征信息的统计方法及其系统 | |
CN106651027B (zh) | 一种基于社交网络的互联网班车线路优化方法 | |
CN104978858A (zh) | 一种基于手机信令的高速公路实时路况监测方法 | |
CN111190891B (zh) | 一种多语义轨迹数据分段存储方法 | |
CN109523819B (zh) | 一种基于公交到离站的乘客ic卡数据与站点匹配方法 | |
CN108091134B (zh) | 一种基于手机信令位置轨迹数据的通用数据集生成方法 | |
CN109684373A (zh) | 基于出行和话单数据分析的重点关系人发现方法 | |
CN110460962B (zh) | 轨道交通用户识别方法和装置 | |
CN114817328A (zh) | 一种水域数据处理方法、装置及系统 | |
CN104361746A (zh) | 一种高速公路智能交通路况监控方法 | |
CN112487256A (zh) | 对象查询方法、装置、设备及存储介质 | |
Chen et al. | A travel mode identification framework based on cellular signaling data | |
Zhao et al. | GLTC: A metro passenger identification method across AFC data and sparse wifi data | |
CN110913345A (zh) | 一种基于手机信令数据的断面客流计算方法 | |
CN115002697B (zh) | 待核查用户的接触用户识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20151216 Assignee: Hubei Dongtu Taiyi Wisdom Technology Co., Ltd. Assignor: Beijing Tuoming Communication Technology Co., Ltd. Contract record no.: 2019990000262 Denomination of invention: Highway passenger vehicle temporary get-on/off recognition method Granted publication date: 20171024 License type: Common License Record date: 20190801 |
|
EE01 | Entry into force of recordation of patent licensing contract |