CN105338541B - 一种基于移动无线网络数据的异常轨迹检测方法及装置 - Google Patents

一种基于移动无线网络数据的异常轨迹检测方法及装置 Download PDF

Info

Publication number
CN105338541B
CN105338541B CN201410307261.8A CN201410307261A CN105338541B CN 105338541 B CN105338541 B CN 105338541B CN 201410307261 A CN201410307261 A CN 201410307261A CN 105338541 B CN105338541 B CN 105338541B
Authority
CN
China
Prior art keywords
track
point
data
histogram feature
track data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410307261.8A
Other languages
English (en)
Other versions
CN105338541A (zh
Inventor
穆亚东
范伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410307261.8A priority Critical patent/CN105338541B/zh
Publication of CN105338541A publication Critical patent/CN105338541A/zh
Application granted granted Critical
Publication of CN105338541B publication Critical patent/CN105338541B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种基于移动无线网络数据的异常轨迹检测方法及装置,涉及通信技术领域,旨在提供一种更精准的异常轨迹检测方法。具体方案为:根据接收到的待测移动终端上报的网络数据计算出待测移动终端的轨迹数据;将轨迹数据所在的目标区域划分为不相重合的目标子区域;将轨迹数据中的各个轨迹点投射到对应的目标子区域中;根据轨迹点在目标子区域中的停留时间,计算得到轨迹数据的直方图特征描述子;根据训练数据集的直方图特征描述子,使用高斯混合模型作为数据的预置生成模型,估计该模型的参数。此后,对于测试数据集中的轨迹数据的直方图特征描述子,根据上述高斯混合模型,计算出每个轨迹数据的异常度值。本发明用于异常轨迹的检测。

Description

一种基于移动无线网络数据的异常轨迹检测方法及装置
技术领域
本发明涉及通信技术领域,尤其涉及一种基于移动无线网络数据的异常轨迹检测方法及装置。
背景技术
随着通信技术的发展,用户终端(例如,手机终端)的普及率越来越高,用户终端在通信过程中通常会产生一些通信数据。例如,用户使用移动终端在移动过程中进行通信,当所述终端占用的源基站的信号强度变差,不足以保证用户的通信质量时,而此时目标基站的信号强度又较强时,终端会在源基站和目标基站之间进行切换。终端在切换基站时,会向基站上报测量报告(Measurement Report,MR)数据,基站收到终端上报的MR数据后,进一步的将所述MR数据上报给无线网络控制器(Radio Network Controller,RNC),RNC接收所述MR数据并存储。
通过用户终端在通信过程中产生的通信数据可以获得用户的移动轨迹。以终端在通信过程中产生的MR数据为例,利用存储在RNC中的MR数据,采用三角定位技术,可以获取到与所述MR数据对应的终端在某一时刻的地理位置坐标,也即终端所属用户在某一时刻的地理位置坐标(如图1所示,通过终端与小区A、B、C基站间的信号强度,确定出终端与小区A、B、C基站间的距离,进而确定出终端的地理位置坐标)。当获取到用户在多个时刻的地理位置坐标时,可以用线段将相邻时刻的地理位置坐标进行连接,以得到该用户的轨迹数据。
由于通信网络具有良好的地理覆盖性,也就是说通信过程中产生的网络数据(例如,MR数据)具有覆盖面广、获取方便的特点。因此,如何基于通信过程中产生的网络数据对用户的移动轨迹进行异常检测已成为本领域技术人员研究的重要课题。
但基于网络数据(例如,MR数据)获得用户轨迹有其独有的特点,例如:
1、用户的地理位置坐标是根据MR数据采用三角定位技术确定的,由于MR数据的精度较低,根据MR数据直接确定的用户地理位置坐标是不准确的,导致根据用户地理位置坐标形成的用户轨迹数据精度不高。
2、由于终端在通信过程中产生的MR数据多,导致MR数据量庞大且数据的复杂性高。
3、由于MR数据采样的频度较低,且采样频度时常随着移动终端的状态发生变化,导致根据MR数据形成的用户轨迹数据具有稀疏性和不均匀性。
目前,尚没有人针对网络数据的如上特点,提出有效可行的异常轨迹检测方法。
发明内容
本发明旨在提供一种基于移动无线网络数据的更精准的异常轨迹检测方法及装置。
为达到上述目的,本发明采用如下技术方案:
本发明的第一方面,提供一种基于移动无线网络数据的异常轨迹检测方法,包括:
根据接收到的待测移动终端上报的网络数据计算出所述待测移动终端的轨迹数据;其中,所述轨迹数据包含多个轨迹点;
将所述轨迹数据所在的目标区域划分为不相重合的目标子区域;
将所述轨迹数据中的各个轨迹点投射到对应的目标子区域中;
根据轨迹点在目标子区域中的停留时间,计算得到所述轨迹数据的直方图特征描述子;其中,所述直方图特征描述子表示出目标子区域的个数与每个目标子区域中轨迹点停留时间的相互关系;
将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,所述高斯混合模型的参数由存储的训练数据集中的样本轨迹数据估计得出。
结合本发明的第一方面,在第一种可能的实现方式中,所述将所述轨迹数据中的各个轨迹点投射到对应的目标子区域中包括:
计算一轨迹点到各个目标子区域中心点的距离;
将所述轨迹点投射到距离最短的四个目标子区域中。
结合本发明的第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据轨迹点在目标子区域中的停留时间,计算得到所述轨迹数据的直方图特征描述子包括:
计算相邻轨迹点的停留时间差值的权重值;
若所述权重值大于第一阈值,且小于第二阈值,则在所述相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使所述相邻轨迹点的停留时间差值的权重值小于或等于所述第一阈值;
将所述虚拟轨迹点投射到对应的目标子区域中;
根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
结合本发明第一方面的第二种可能的实现方式,在第三种可能的实现方式中,计算相邻轨迹点的停留时间差值的权重值,具体包括:
根据公式:计算相邻轨迹点的停留时间差值的权重值;
其中,q表示相邻轨迹点的停留时间差值的权重值,△t表示相邻轨迹点间的时间差,n表示在相邻轨迹点的轨迹段上插入的虚拟轨迹点的个数。
结合本发明第一方面的第二种可能的实现方式或第三种可能的实现方式,在第四种可能的实现方式中,所述根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子包括:
根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子;
对所述直方图特征描述子进行归一化处理,得到归一化后的直方图特征描述子。
结合本发明第一方面的第二种可能的实现方式,在第五种可能的实现方式中,若所述权重值大于或等于第二阈值,则将所述相邻轨迹点中的起始轨迹点作为前一轨迹数据的终点轨迹点,将所述相邻轨迹点中的终止轨迹点作为后一轨迹数据的起始轨迹点,忽略所述相邻轨迹点构成的轨迹数据。
结合本发明的第一方面,在第六种可能的实现方式中,所述高斯混合模型的参数估计过程包括:
计算存储的训练数据集中的样本轨迹数据的直方图特征描述子;
将所述样本轨迹数据的直方图特征描述子代入到高斯混合模型中,得到所述高斯混合模型的参数的估计值。
本发明的第二方面,提供一种异常轨迹检测装置,包括:
轨迹数据计算模块,用于根据接收到的待测移动终端上报的网络数据计算出所述待测移动终端的轨迹数据;其中,所述轨迹数据包含多个轨迹点;
区域划分模块,用于将所述轨迹数据所在的目标区域划分为不相重合的目标子区域;
投射模块,用于将所述轨迹数据中的各个轨迹点投射到对应的目标子区域中;
直方图特征描述子计算模块,用于根据轨迹点在目标子区域中的停留时间,计算得到所述轨迹数据的直方图特征描述子;其中,所述直方图特征描述子表示出目标子区域的个数与每个目标子区域中轨迹点停留时间的相互关系;
异常度值计算模块,将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,所述高斯混合模型的参数由存储的训练数据集估计得出。
结合本发明的第二方面,在第一种可能的实现方式中,所述投射模块包括:
距离计算单元,用于计算一轨迹点到各个目标子区域中心点的距离;
投射单元,用于将所述轨迹点投射到距离最短的四个目标子区域中。
结合本发明的第二方面或第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述直方图特征描述子计算模块包括:
权重值计算单元,用于计算相邻轨迹点的停留时间差值的权重值;
虚拟轨迹点插入单元,用于若所述权重值大于第一阈值,且小于第二阈值,则在所述相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使所述相邻轨迹点的停留时间差值的权重值小于或等于所述第一阈值;
直方图特征描述子计算单元,用于根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
结合本发明第二方面的第二种可能的实现方式,在第三种可能的实现方式中,
所述权重值计算单元,具体用于根据公式:计算相邻轨迹点的停留时间差值的权重值;
其中,q表示相邻轨迹点的停留时间差值的权重值,△t表示相邻轨迹点间的时间差,n表示在相邻轨迹点的轨迹段上插入的虚拟轨迹点的个数。
结合本发明第二方面的第二种可能的实现方式或第三种可能的实现方式,在第四种可能的实现方式中,所述直方图特征描述子计算单元包括:
直方图计算子单元,根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子;
归一化子单元,用于对所述直方图特征描述子进行归一化处理,得到归一化后的直方图特征描述子。
结合本发明的第二方面,在第五种可能的实现方式中,所述异常度值计算模块包括:
样本直方图计算单元,用于计算存储的训练数据集中的样本轨迹数据的直方图特征描述子;
高斯混合模型的参数估计单元,用于将所述样本轨迹数据的直方图特征描述子代入到高斯混合模型中,得到所述高斯混合模型的参数的估计值;
异常度值计算单元,用于将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值。
本发明提供的基于移动无线网络数据的异常轨迹检测方法及装置,针对由网络数据计算出的准确度较低的轨迹数据,先将其所在的目标区域划分为不相重合的目标子区域,再将该轨迹数据中的各个轨迹点投射到对应的目标子区域中,从而实现了对轨迹数据的细化处理。之后,根据轨迹点在目标子区域中的停留时间,计算得到表示出目标子区域与轨迹点停留时间的相互关系的直方图特征描述子,从而进一步突出了轨迹数据中各个轨迹点细化后的特征。最后,利用大量的样本轨迹数据比对出每个轨迹数据的异常度值,以便人们进行分析判断。可以看出,通过本发明实施例提供的方案,能够对现有的轨迹数据进行精细化处理,提高了比对数据的精度,能够实现较为精准的异常轨迹检测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中利用三角定位技术确定终端位置坐标的示意图;
图2为本发明实施例提供的基于移动无线网络数据的异常轨迹检测方法的流程框图;
图3为本发明另一实施例提供的基于移动无线网络数据的异常轨迹检测方法流程示意图;
图4为本发明实施例提供的目标区域划分示意图;
图5为本发明实施例提供的虚拟轨迹点插入示意图;
图6为本发明实施例提供的轨迹数据的直方图特征描述子的示意图;
图7为本发明实施例提供的异常轨迹检测装置的结构示意图;
图8为本发明实施例提供的另一种异常轨迹检测装置的结构示意图;
图9为本发明另一实施例提供的异常轨迹的检测装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,由于移动通信网络具有良好的地理覆盖性,也就是说移动通信过程中产生的网络数据(例如,MR数据)具有覆盖面广、获取方便的特点。因此,可以利用移动通信过程中产生的网络数据进行对用户位置定位,当获取到用户在某一时刻的地理位置坐标时,可以将用户在多个时刻的地理位置坐标用线段连接起来,便可以得到用户的轨迹数据。通过对特定区域中的大量用户轨迹进行分析,可以识别出该区域中的异常轨迹。
另外,根据背景技术中的描述可以得知,网络数据由于自身原因存在着诸如内容不准确、间隔时间长、数据量大等问题,对轨迹的异常检测造成了很多不利影响。
需要说明的是,本发明的各个实施例中,均以MR数据作为网络数据进行说明,但所提供的方法、装置可以适用于与MR数据有相同特点的其他网络数据,对此,本发明实施例不对网络数据的类型做具体限制。
为了便于本领域技术人员理解,本发明实施例提供的技术方案具体的实施过程可以参考本发明提供的以下实施例。
本发明实施例提供一种基于移动无线网络数据的异常轨迹检测方法,如图2所示,该方法步骤可以包括:
S201、根据接收到的待测移动终端上报的网络数据计算出待测移动终端的轨迹数据;其中,该轨迹数据包含多个轨迹点。
其中,网络数据可以为MR数据,也可以为与MR数据具有类似特点的数据。以MR数据为例,根据MR数据计算轨迹数据的过程可以为:利用MR数据,采用如图1所示的三角定位技术,获得该待测移动终端在某一时刻的地理位置坐标——即轨迹点,以此类推,当获取到待测移动终端在多个时刻的轨迹点后,可以用线段将相邻时刻的轨迹点进行连接,从而得到该待测移动终端的迹数据。
S202、将轨迹数据所在的目标区域划分为不相重合的目标子区域。
S203、将轨迹数据中的各个轨迹点投射到对应的目标子区域中。
S204、根据轨迹点在目标子区域中的停留时间,计算得到该轨迹数据的直方图特征描述子;其中,直方图特征描述子表示出目标子区域的个数与每个目标子区域中轨迹点停留时间的相互关系。
S205、将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,该高斯混合模型的参数由存储的训练数据集中的样本轨迹数据估计得出。
优选地,可以根据训练数据集中的样本轨迹数据的直方图特征描述子,使用高斯混合模型作为数据的预置生成模型,估计该模型的参数。然后,对于各个轨迹数据的直方图特征描述子,根据上述高斯混合模型,计算出每个轨迹数据的异常度值。异常度值可以是某一轨迹偏离正常轨迹的偏离度值。
本发明实施例提供的基于移动无线网络数据的异常轨迹检测方法,针对由网络数据计算出的准确度较低的轨迹数据,先将其所在的目标区域划分为不相重合的目标子区域,再将该轨迹数据中的各个轨迹点投射到对应的目标子区域中,从而实现了对轨迹数据的细化处理。之后,根据轨迹点在目标子区域中的停留时间,计算得到表示出目标子区域与轨迹点停留时间的相互关系的直方图特征描述子,从而进一步突出了轨迹数据中各个轨迹点细化后的特征。最后,利用大量的样本轨迹数据比对出每个轨迹数据的异常度值,以便人们进行分析判断。可以看出,通过本发明实施例提供的方案,能够对现有的轨迹数据进行精细化处理,提高了比对数据的精度,能够实现较为精准的异常轨迹检测。
进一步地,在上述优选实施例中,步骤S203可以具体包括:
计算一轨迹点到各个目标子区域中心点的距离。
将该轨迹点投射到距离最短的四个目标子区域中。
进一步地,在上述优选实施例中,步骤S204可以具体包括:
计算相邻轨迹点的停留时间差值的权重值。
若该权重值大于第一阈值,且小于第二阈值,则在相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使该相邻轨迹点的停留时间差值的权重值小于或等于第一阈值。
将虚拟轨迹点投射到对应的目标子区域中。
根据轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
进一步地,在上述优选实施例中,步骤S205中高斯混合模型的参数估计过程可以包括:
计算存储的训练数据集中的样本轨迹数据的直方图特征描述子。
将样本轨迹数据的直方图特征描述子代入到高斯混合模型中,得到高斯混合模型的参数的估计值。
本发明另一实施例提供一种基于移动无线网络数据的异常轨迹检测方法,以MR数据作为网络数据为例,如图3所示,其步骤包括:
S301、根据接收到的待测移动终端上报的MR数据计算出待测移动终端的轨迹数据;其中,该轨迹数据包含多个轨迹点。
S302、将轨迹数据所在的目标区域划分为不相重合的目标子区域。
具体的,针对目标区域,可以根据手工指定的参数确定网格的间距,进而根据目标区域的面积和网格的间距确定网格的个数,将目标区域划分为不相重合的目标子区域。如图4所示,例如将目标区域划分为56个不相重合的目标子区域。进一步地,还可以对划分后的目标子区域进行标号。
需要说明的是,本步骤中对目标区域划分,划分后尽量使得每个目标子区域都能够包含有合适数量的轨迹点,这样便可部分缓解轨迹数据存在的稀疏性的问题。若划分得太密集,那么每个目标子区域的面积会很小,由于轨迹数据具有稀疏性,会导致部分目标子区域未包含轨迹数据中的任何轨迹点;若划分的太稀疏,则会导致同一目标子区域包含的轨迹点过多,均不利于后续的精细化处理。
S303、计算一轨迹点到各个目标子区域中心点的距离。
S304、将该轨迹点投射到距离最短的四个目标子区域中。
在此,轨迹点投射时,可以采用与双线性插值类似的方法,即将轨迹点投射到多个目标子区域,目标子区域的中心点离轨迹点越近,则该目标子区域的投射权重(weight)越大,反之,目标子区域的中心点离轨迹点越远,则该目标子区域的投射权重越小。如图4所示,在本实施例中,轨迹点A与目标子区域41、42、43、44四个画有斜线的目标子区域距离最短,因此,将轨迹点A投射到目标子区域41、42、43、44。
在此,将轨迹点投射到四个目标子区域中,则可以针对轨迹数据的不确定性起到一定的缓解作用。
S305、计算相邻轨迹点的停留时间差值的权重值。
S306、判断权重值,若该权重值大于第一阈值,且小于第二阈值,则执行步骤S308至S312,否则执行步骤S307
S307、判断权重值,若该权重值大于或等于第二阈值,则执行步骤S313,否则执行步骤S310至S312。
S308、在相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使相邻轨迹点的停留时间差值的权重值小于或等于所述第一阈值。
具体的,如图5所示,设轨迹点B为轨迹数据中的任意轨迹点,轨迹点C为轨迹数据中与轨迹点B相邻的下一个轨迹点。当轨迹点C与轨迹点B间的停留时间差值大于第一阈值,且小于第二阈值时,表明得到轨迹点C的MR数据上报时间点与得到轨迹点B的MR数据上报时间点之间间隔了较长时间。这正是由于MR数据的稀疏性引起的。
在本优选实施例中,为了缓解轨迹数据存在的稀疏性的问题,可以在轨迹点B和轨迹点C之间插入一些虚拟轨迹点,以细化轨迹点B、C之间的轨迹。在本实施例中,如图5所示,可以在相邻轨迹点B、C间的轨迹段上等距离插入3个虚拟轨迹点D、E、F。
现提出一个公式来明确计算相邻轨迹点间的停留时间差值的权重值,以便计算比对。根据公式计算相邻的轨迹点B与轨迹点C的停留时间差值的权重值。其中,q表示相邻轨迹点的停留时间差值的权重值,△t表示相邻轨迹点间的时间差,n表示在相邻轨迹点的轨迹段上插入的虚拟轨迹点的个数。在首次计算时,虚拟轨迹点的个数n为0。
假设第一阈值为6,轨迹点B与轨迹点C的停留时间差值为20秒,则首次计算时q=20/1=20,大于第一阈值。在插入1个虚拟轨迹点后q=20/(1+1)=10,仍大于第一阈值。在插入2个虚拟轨迹点后,q=20/(1+2)=6.67,仍大于第一阈值。在插入3个虚拟轨迹点后,q=20/1+3=5,小于第一阈值,说明在轨迹点B与轨迹点C之间插入3个虚拟轨迹点合适。
在此,通过插入虚拟轨迹点的操作,丰富了轨迹数据中的轨迹点,很大程度上解决了轨迹数据的稀疏性问题。
S309、将虚拟轨迹点投射到对应的目标子区域中。
本步骤的投射方法与步骤S304的投射过程相同,不再赘述。
S310、根据轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
在本步骤中,先将步骤S305中计算得到的相邻轨迹点间的停留时间差值的权重值记为该相邻轨迹点中起始轨迹点的时长权重值。因而能够得到每个目标子区域中投射的轨迹点的时长权重值。进而得一条轨迹数据的直方图特征描述子。该直方图特征描述子的横坐标是各个目标子区域的标号,纵坐标是各个轨迹点在对应的目标子区域中的时长权重值。如图6所示,例如,若目标区域被划分为100个目标子区域,并对划分后的100个目标子区域进行标号。然后将构成轨迹数据的轨迹点、虚拟轨迹点分别投射到对应的目标子区域中,计算这100个目标子区域中投射的轨迹点的时长权重值,从而可以得到该轨迹数据的轨迹点的直方图特征描述子。图6中横坐标为不同的目标子区域,如1为目标子区域1,2为目标子区域2,……100为目标子区域100。图6中纵坐标为轨迹点在对应的目标子区域中的时长权重值。
S311、对该直方图特征描述子进行归一化处理,得到归一化后的直方图特征描述子。
在本优选实施例中,直方图的原始特征x=(x1,x2,…,xd),归一化处理后的特征为:
其中,为归一化后的直方图特征,x1为目标子区域1的直方图特征。x2为目标子区域2的直方图特征,…,xd为目标子区域d的直方图特征。
S312、将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,该高斯混合模型的参数由存储的训练数据集中的样本轨迹数据估计得出。
具体的,可以首先计算得到存储的训练数据集中的样本轨迹数据的直方图特征描述子。再使用高斯混合模型,代入样本轨迹数据的直方图特征描述子,估计该模型的参数。在此,通过多次将样本轨迹数据的直方图特征描述子代入到高斯混合模型中,使得所得参数动态变化,直至高斯混合模型的参数趋于稳定,估计出该模型的参数。
最后,将各个轨迹数据的直方图特征描述子代入到该高斯混合模型中进行计算,得到每个轨迹数据的异常度值。
S313、将相邻轨迹点中的起始轨迹点作为前一轨迹数据的终点轨迹点,将相邻轨迹点中的终止轨迹点作为后一轨迹数据的起始轨迹点,忽略该相邻轨迹点构成的轨迹数据。
其中,例如,相邻轨迹点中的起始轨迹点为用户前一天关机前的轨迹点,相邻轨迹点中的终止轨迹点为用户第二天开机后的轨迹点,这样,起始轨迹点和终止轨迹点间的间隔较长,在这段间隔时间内用户的轨迹数据是缺失的,此段缺失的轨迹数据无法研究,则将该相邻轨迹点中的起始轨迹点作为前一轨迹数据的终点轨迹点,将该相邻轨迹点中的终止轨迹点作为后一轨迹数据的起始轨迹点,忽略该相邻轨迹点构成的轨迹数据。
需要说明的是,对于前一轨迹数据和后一轨迹数据的检测方法可以参照步骤S302至S312中的详细说明,本处不再赘述。
本发明实施例提供的基于MR数据的异常轨迹检测方法,针对由MR数据计算出的准确度较低的轨迹数据,先将其所在的目标区域划分为不相重合的目标子区域,再将该轨迹数据中的各个轨迹点投射到对应的目标子区域中,从而实现了对轨迹数据的细化处理。之后,根据轨迹点在目标子区域中的停留时间,计算得到表示出目标子区域与轨迹点停留时间的相互关系的直方图特征描述子,从而进一步突出了轨迹数据中各个轨迹点细化后的特征。最后,利用大量的样本轨迹数据比对出每个轨迹数据的异常度值,以便人们进行分析判断。可以看出,通过本发明实施例提供的方案,能够对现有的轨迹数据进行精细化处理,提高了比对数据的精度,能够实现较为精准的异常轨迹检测。
进一步地,可以根据上述方法计算得到的各个轨迹数据的异常度值得到异常轨迹的可疑列表,然后对可疑列表中的轨迹数据进一步由人工进行判断,通过观察确定出最终的可疑轨迹。可以看出,经过本实施例的计算,可以为人工判断提供便捷准确的数据,极大地提高了人工判断的速度。
本发明实施例提供的异常轨迹检测装置70,能够应用于上述优选实施例中,执行该优选实施例中的所有操作。如图7所示,该装置包括:
轨迹数据计算模块71,用于根据接收到的待测移动终端上报的网络数据计算出待测移动终端的轨迹数据;其中,轨迹数据包含多个轨迹点。
区域划分模块72,用于将轨迹数据所在的目标区域划分为不相重合的目标子区域。
投射模块73,用于将轨迹数据中的各个轨迹点投射到对应的目标子区域中。
直方图特征描述子计算模块74,用于根据轨迹点在目标子区域中的停留时间,计算得到该轨迹数据的直方图特征描述子;其中,该直方图特征描述子表示出目标子区域的个数与每个目标子区域中轨迹点停留时间的相互关系。
异常度值计算模块75,将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,高斯混合模型的参数由存储的训练数据集估计得出。
本发明实施例提供的异常轨迹检测装置,针对由网络数据计算出的准确度较低的轨迹数据,先将其所在的目标区域划分为不相重合的目标子区域,再将该轨迹数据中的各个轨迹点投射到对应的目标子区域中,从而实现了对轨迹数据的细化处理。之后,根据轨迹点在目标子区域中的停留时间,计算得到表示出目标子区域与轨迹点停留时间的相互关系的直方图特征描述子,从而进一步突出了轨迹数据中各个轨迹点细化后的特征。最后,利用大量的样本轨迹数据比对出每个轨迹数据的异常度值,以便人们进行分析判断。可以看出,通过本发明实施例提供的方案,能够对现有的轨迹数据进行精细化处理,提高了比对数据的精度,能够实现较为精准的异常轨迹检测。
进一步地,如图8所示,上述优选实施例中,投射模块包括73可以包括:
距离计算单元731,用于计算一轨迹点到各个目标子区域中心点的距离。
投射单元732,用于将轨迹点投射到距离最短的四个目标子区域中。
进一步地,直方图特征描述子计算模块74可以包括:
权重值计算单元741,用于计算相邻轨迹点的停留时间差值的权重值。
虚拟轨迹点插入单元742,用于若权重值大于第一阈值,且小于第二阈值,则在相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使该相邻轨迹点的停留时间差值的权重值小于或等于所述第一阈值。
此时,投射模块73会将虚拟轨迹点插入单元742插入的虚拟轨迹点投射到对应的目标子区域中。
直方图特征描述子计算单元743,用于根据轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
此外,进一步地,权重值计算单元741,具体可以用于根据公式:计算相邻轨迹点的停留时间差值的权重值;其中,q表示相邻轨迹点的停留时间差值的权重值,△t表示相邻轨迹点间的时间差,n表示在相邻轨迹点的轨迹段上插入的虚拟轨迹点的个数。
进一步地,直方图特征描述子计算单元743可以包括:
直方图计算子单元7431,根据轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
归一化子单元7432,用于对直方图特征描述子进行归一化处理,得到归一化后的直方图特征描述子。
进一步地,异常度值计算模块75可以包括:
样本直方图计算单元751,用于计算存储的训练数据集中的样本轨迹数据的直方图特征描述子。
高斯混合模型的参数估计单元752,用于将样本轨迹数据的直方图特征描述子代入到高斯混合模型中,得到高斯混合模型的参数的估计值。
异常度值计算单元753,用于将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值。
进一步地,该异常轨迹检测装置70还可以包括一数据库模块76,用来存储样本轨迹数据。
本发明另一实施例提供一种异常轨迹的检测装置,如图9所示,该异常轨迹检测装置包括至少一个处理器901(例如CPU),存储器903,和至少一个通信总线904,用于实现内部的连接通信。处理器901用于执行存储器903中存储的可执行模块,例如计算机程序。存储器903可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。
在一些实施方式中,存储器903存储了程序905,程序905可以被处理器901执行,这个程序包括执行一种基于移动无线网络数据的异常轨迹检测方法,该方法包括:
根据接收到的待测移动终端上报的网络数据计算出待测移动终端的轨迹数据;其中,轨迹数据包含多个轨迹点。
将轨迹数据所在的目标区域划分为不相重合的目标子区域。
将轨迹数据中的各个轨迹点投射到对应的目标子区域中。
根据轨迹点在目标子区域中的停留时间,计算得到轨迹数据的直方图特征描述子;其中,直方图特征描述子表示出目标子区域的个数与每个目标子区域中轨迹点停留时间的相互关系。
将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,该高斯混合模型的参数由存储的训练数据集中的样本轨迹数据估计得出。
上述执行基于移动无线网络数据的异常轨迹检测方法的程序,优选的,所述将轨迹数据中的各个轨迹点投射到对应的目标子区域中包括:
计算一轨迹点到各个目标子区域中心点的距离。
将轨迹点投射到距离最短的四个目标子区域中。
上述执行基于移动无线网络数据的异常轨迹检测方法的程序,优选的,所述根据轨迹点在目标子区域中的停留时间,计算得到轨迹数据的直方图特征描述子包括:
计算相邻轨迹点的停留时间差值的权重值。
若权重值大于第一阈值,且小于第二阈值,则在相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使相邻轨迹点的停留时间差值的权重值小于或等于所述第一阈值。
将虚拟轨迹点投射到对应的目标子区域中;
根据轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
上述执行基于移动无线网络数据的异常轨迹检测方法的程序,优选的,计算相邻轨迹点的停留时间差值的权重值,具体包括:
根据公式:计算相邻轨迹点的停留时间差值的权重值。
其中,q表示相邻轨迹点的停留时间差值的权重值,△t表示相邻轨迹点间的时间差,n表示在相邻轨迹点的轨迹段上插入的虚拟轨迹点的个数。
上述执行基于移动无线网络数据的异常轨迹检测方法的程序,优选的,所述根据轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子包括:
根据轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
对直方图特征描述子进行归一化处理,得到归一化后的直方图特征描述子。
上述执行基于移动无线网络数据的异常轨迹检测方法的程序,优选的,若权重值大于或等于第二阈值,则将相邻轨迹点中的起始轨迹点作为前一轨迹数据的终点轨迹点,将相邻轨迹点中的终止轨迹点作为后一轨迹数据的起始轨迹点,忽略相邻轨迹点构成的轨迹数据。
上述执行基于移动无线网络数据的异常轨迹检测方法的程序,优选的,高斯混合模型的参数估计过程包括:
计算存储的训练数据集中的样本轨迹数据的直方图特征描述子。
将样本轨迹数据的直方图特征描述子代入到高斯混合模型中,得到高斯混合模型的参数的估计值。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (13)

1.一种基于移动无线网络数据的异常轨迹检测方法,其特征在于,包括:
根据接收到的待测移动终端上报的网络数据计算出所述待测移动终端的轨迹数据;其中,所述轨迹数据包含多个轨迹点;
将所述轨迹数据所在的目标区域划分为不相重合的目标子区域;
将所述轨迹数据中的各个轨迹点投射到对应的目标子区域中;
根据轨迹点在目标子区域中的停留时间,计算得到所述轨迹数据的直方图特征描述子;其中,所述直方图特征描述子表示出目标子区域的个数与每个目标子区域中轨迹点停留时间的相互关系;
将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,所述高斯混合模型的参数由存储的训练数据集中的样本轨迹数据估计得出。
2.根据权利要求1所述的方法,其特征在于,所述将所述轨迹数据中的各个轨迹点投射到对应的目标子区域中包括:
计算一轨迹点到各个目标子区域中心点的距离;
将所述轨迹点投射到距离最短的四个目标子区域中。
3.根据权利要求1或2所述的方法,其特征在于,所述根据轨迹点在目标子区域中的停留时间,计算得到所述轨迹数据的直方图特征描述子包括:
计算相邻轨迹点的停留时间差值的权重值;
若所述权重值大于第一阈值,且小于第二阈值,则在所述相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使所述相邻轨迹点的停留时间差值的权重值小于或等于所述第一阈值;
将所述虚拟轨迹点投射到对应的目标子区域中;
根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
4.根据权利要求3所述的方法,其特征在于,计算相邻轨迹点的停留时间差值的权重值,具体包括:
根据公式:计算相邻轨迹点的停留时间差值的权重值;
其中,q表示相邻轨迹点的停留时间差值的权重值,△t表示相邻轨迹点间的时间差,n表示在相邻轨迹点的轨迹段上插入的虚拟轨迹点的个数。
5.根据权利要求3所述的方法,其特征在于,所述根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子包括:
根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子;
对所述直方图特征描述子进行归一化处理,得到归一化后的直方图特征描述子。
6.根据权利要求3所述的方法,其特征在于,若所述权重值大于或等于第二阈值,则将所述相邻轨迹点中的起始轨迹点作为前一轨迹数据的终点轨迹点,将所述相邻轨迹点中的终止轨迹点作为后一轨迹数据的起始轨迹点,忽略所述相邻轨迹点构成的轨迹数据。
7.根据权利要求1所述的方法,其特征在于,所述高斯混合模型的参数估计过程包括:
计算存储的训练数据集中的样本轨迹数据的直方图特征描述子;
将所述样本轨迹数据的直方图特征描述子代入到高斯混合模型中,得到所述高斯混合模型的参数的估计值。
8.一种异常轨迹检测装置,其特征在于,包括:
轨迹数据计算模块,用于根据接收到的待测移动终端上报的网络数据计算出所述待测移动终端的轨迹数据;其中,所述轨迹数据包含多个轨迹点;
区域划分模块,用于将所述轨迹数据所在的目标区域划分为不相重合的目标子区域;
投射模块,用于将所述轨迹数据中的各个轨迹点投射到对应的目标子区域中;
直方图特征描述子计算模块,用于根据轨迹点在目标子区域中的停留时间,计算得到所述轨迹数据的直方图特征描述子;其中,所述直方图特征描述子表示出目标子区域的个数与每个目标子区域中轨迹点停留时间的相互关系;
异常度值计算模块,将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值;其中,所述高斯混合模型的参数由存储的训练数据集估计得出。
9.根据权利要求8所述的装置,其特征在于,所述投射模块包括:
距离计算单元,用于计算一轨迹点到各个目标子区域中心点的距离;
投射单元,用于将所述轨迹点投射到距离最短的四个目标子区域中。
10.根据权利要求8或9所述的装置,其特征在于,所述直方图特征描述子计算模块包括:
权重值计算单元,用于计算相邻轨迹点的停留时间差值的权重值;
虚拟轨迹点插入单元,用于若所述权重值大于第一阈值,且小于第二阈值,则在所述相邻轨迹点的轨迹段上等距离插入至少一个虚拟轨迹点,以使所述相邻轨迹点的停留时间差值的权重值小于或等于所述第一阈值;
直方图特征描述子计算单元,用于根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子。
11.根据权利要求10所述的装置,其特征在于,
所述权重值计算单元,具体用于根据公式:计算相邻轨迹点的停留时间差值的权重值;
其中,q表示相邻轨迹点的停留时间差值的权重值,△t表示相邻轨迹点间的时间差,n表示在相邻轨迹点的轨迹段上插入的虚拟轨迹点的个数。
12.根据权利要求10所述的装置,其特征在于,所述直方图特征描述子计算单元包括:
直方图计算子单元,根据所述轨迹数据上的轨迹点和虚拟轨迹点,计算得到直方图特征描述子;
归一化子单元,用于对所述直方图特征描述子进行归一化处理,得到归一化后的直方图特征描述子。
13.根据权利要求8所述的装置,其特征在于,所述异常度值计算模块包括:
样本直方图计算单元,用于计算存储的训练数据集中的样本轨迹数据的直方图特征描述子;
高斯混合模型的参数估计单元,用于将所述样本轨迹数据的直方图特征描述子代入到高斯混合模型中,得到所述高斯混合模型的参数的估计值;
异常度值计算单元,用于将各个轨迹数据的直方图特征描述子,利用高斯混合模型,计算出每个轨迹数据的异常度值。
CN201410307261.8A 2014-06-30 2014-06-30 一种基于移动无线网络数据的异常轨迹检测方法及装置 Active CN105338541B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410307261.8A CN105338541B (zh) 2014-06-30 2014-06-30 一种基于移动无线网络数据的异常轨迹检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410307261.8A CN105338541B (zh) 2014-06-30 2014-06-30 一种基于移动无线网络数据的异常轨迹检测方法及装置

Publications (2)

Publication Number Publication Date
CN105338541A CN105338541A (zh) 2016-02-17
CN105338541B true CN105338541B (zh) 2018-11-13

Family

ID=55288741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410307261.8A Active CN105338541B (zh) 2014-06-30 2014-06-30 一种基于移动无线网络数据的异常轨迹检测方法及装置

Country Status (1)

Country Link
CN (1) CN105338541B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599561A (zh) * 2016-12-06 2017-04-26 北京中交兴路信息科技有限公司 一种轨迹数据清洗方法及装置
CN108683995B (zh) * 2018-03-23 2020-06-19 广州杰赛科技股份有限公司 用户移动轨迹的获得方法和装置
CN111179136A (zh) * 2019-08-01 2020-05-19 北京百分点信息科技有限公司 一种动态管控方法、装置、电子设备
CN111090685B (zh) * 2019-12-19 2023-08-22 第四范式(北京)技术有限公司 一种数据异常特征的检测方法及装置
CN117272217B (zh) * 2023-11-23 2024-01-26 生命奇点(北京)科技有限公司 一种地理区域的异常分析系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101363740A (zh) * 2007-08-07 2009-02-11 株式会社电装 位置校正设备
EP2333629A1 (en) * 2008-10-09 2011-06-15 Hitachi, Ltd. Error detection method and system
CN103235933A (zh) * 2013-04-15 2013-08-07 东南大学 一种基于隐马尔科夫模型的车辆异常行为检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101363740A (zh) * 2007-08-07 2009-02-11 株式会社电装 位置校正设备
EP2333629A1 (en) * 2008-10-09 2011-06-15 Hitachi, Ltd. Error detection method and system
CN103235933A (zh) * 2013-04-15 2013-08-07 东南大学 一种基于隐马尔科夫模型的车辆异常行为检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
实时异常轨迹检测方法及其应用;夏英等;《重庆邮电大学学报(自然科学版)》;20120115;全文 *

Also Published As

Publication number Publication date
CN105338541A (zh) 2016-02-17

Similar Documents

Publication Publication Date Title
CN105338541B (zh) 一种基于移动无线网络数据的异常轨迹检测方法及装置
CN108040318B (zh) 一种定位方法、电子设备及计算机可读存储介质
CN111896914A (zh) 一种协同定位方法、装置、设备和存储介质
CN103379433B (zh) 测距报警的方法与装置
CN104535064A (zh) 一种Wi-Fi指纹辅助的室内移动终端惯性导航方法
CN103596263B (zh) 一种室内定位中获取位置的方法及装置
CN104796866A (zh) 室内定位方法和装置
CN106773783B (zh) 一种连续运行参考站系统的半物理仿真测试系统及方法
CN104335064A (zh) 改进的三边测量处理
CN106899985A (zh) 一种网络覆盖的评估方法及装置
US9554253B2 (en) Locating method, drive test terminal and hand-held terminal
WO2013117092A1 (zh) 一种路测方法及系统
CN108226860A (zh) 基于rss的超宽带混合维定位方法及定位系统
Suprun et al. Extraction of a weak phase from B→ D (*) π
CN109756837A (zh) 定位方法及装置
CN103476111A (zh) 一种获取地理位置信息的方法,装置及系统
CN104507097A (zh) 一种基于WiFi位置指纹的半监督训练方法
CN107390631A (zh) 一种用于转弯机动目标的轨迹起始方法及系统
CN106384023A (zh) 基于主路径的混合场强预测方法
CN107688189B (zh) 一种gps经纬度坐标的校准方法、装置和移动运动设备
de la Osa et al. Positioning evaluation and ground truth definition for real life use cases
CN105738924A (zh) 卫星导航信号模拟器伪距控制精度的校准系统和方法
CN105992337A (zh) 一种伪基站定位方法及设备
Arai et al. Color radiomap interpolation for efficient fingerprint wifi-based indoor location estimation
CN105992239B (zh) 一种实时定位伪基站的方法、装置和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant