CN109104694B - 一种基于手机信令的用户停留位置发现方法及系统 - Google Patents
一种基于手机信令的用户停留位置发现方法及系统 Download PDFInfo
- Publication number
- CN109104694B CN109104694B CN201810671489.3A CN201810671489A CN109104694B CN 109104694 B CN109104694 B CN 109104694B CN 201810671489 A CN201810671489 A CN 201810671489A CN 109104694 B CN109104694 B CN 109104694B
- Authority
- CN
- China
- Prior art keywords
- data
- position point
- point
- user
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W64/00—Locating users or terminals or network equipment for network management purposes, e.g. mobility management
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本发明涉及一种基于手机信令的用户停留位置发现方法及系统,其方法包括:将获取到的用户的手机信令数据作为原始轨迹数据,并将原始轨迹数据依次经过数据清理、数据切片、初步类聚、数据校验、核心簇计算的处理,最终得到用户停留位置。采用了轨迹切片聚合、层次聚类算法、核密度聚类算法、机器学习算法等一系列算法,综合考虑手机轨点密度、信令时间间隔、轨迹点移动方向和移动距离等指标,判断用户停留位置、停留时长、进入和离开停留点时刻。解决了传统聚类算法无法适配处理时空数据的缺点,算法能够有效排除基站漂移对用户定位判断的干扰,提高了用户驻留点位置及停留起止时间识别精度,客观还原了用户停留位置。
Description
技术领域
本发明涉及手机信令数据领域,尤其涉及一种基于手机信令的用户停留位置发现方法及系统。
背景技术
目前基于手机信令的用户停留位置发现目前主要两种技术途径:
一、根据固定的空间单元统计用户在该区域内累积的停留时长,计算区域的几何中心为停留位置,最开始和最后出现的轨迹时间最为本次停留的起止时间。
二、基于传统的空间数据聚类算法,按照一定半径做邻域搜索,满足在此范围的数据聚合为一类,当聚合的数据累加的时长超过一定阈值判断该类为停留组,去组几何中心为停留位置。
然而在现有技术途径一中,并未按照用户的真实活动轨迹识别,只能针对固定时段和固定区域识别,并且受到划定监测区域大小和基站信号飘移的影响。
在现有技术途径二中,一旦发生较长距离的信号飘移,就会将用户的一次停留活动拆分为多次。而长距离的信号飘移在移动通讯网络中非常普遍,特别是在偏远地区和信号覆盖不好的区域。
由于手机信令数据是一组非等时、等距回传,定位频繁跳跃且具有时间顺序的时空数据,传统的GPS处理算法和聚类算法并不适用。
发明内容
本发明为了解决上述技术问题提供一种基于手机信令的用户停留位置发现方法。
本发明解决上述技术问题的技术方案如下:一种基于手机信令的用户停留位置发现方法,包括以下几个步骤:
S1,将获取到的用户的手机信令数据作为原始轨迹数据,并对所述原始轨迹数据进行清洗处理,得到初步轨迹数据;
S2,将所述初步轨迹数据按照预设的时间间隔进行切片,得到多个轨迹片段,并将每个所述轨迹片段分别进行空间聚合,得到与每个所述轨迹片对应的第一位置点,并对所述第一位置点按照切片时间升序进行编号;
S3,将所述第一位置点按照编号从小到大的顺序进行初步类聚,通过所述初步类聚,将相邻的所述第一位置点之间的距离小于预设阈值L1的两个所述第一位置点聚合为一个第一位置点组,以此类推,得到多个第一位置点组;将每个所述第一位置点组均进行几何中心计算,得到与每个所述第一位置点组对应的第二位置点;
S4,按照时间升序排列所述第二位置点,以第一个所述第二位置点作为参照点,按照排列顺依次校验所述参考点后的第二位置点;
若校验出不合格的第二位置点,则将所述不合格的第二位置点与所述参照点进行合并,得到新的第二位置点,并以所述新的第二位置点后一位的第二位置点作为新的参照点;
若检验出合格的第二位置点,则将所述合格的第二位置点进行保留并以所述合格的第二位置点的后一个第二位置点作为新的参照点,并将所述第一个所述第二位置点也作为所述合格的第二位置点;
以此类推,将所述新的第二位置点和所述合格的第二位置点作为初步停留点;
S5,通过DBSAN-基于密度聚类算法将所述初步停留点划分为多个簇,计算每个所述簇中初步停留点对应时间的累加值,选取出累加值大于或等于累加值阈值的簇作为停留核心簇;
S6,获取每个所述停留核心簇的空间平均位置,以所述停留核心簇的空间平均位置作为用户停留位置。
本发明的有益效果是:通过采用了轨迹切片聚合、层次聚类算法、核密度聚类算法、机器学习算法等一系列算法,并综合考虑手机轨点密度、信令时间间隔、轨迹点移动方向和移动距离等指标,判断用户停留位置、停留时长、进入和离开停留点时刻。
解决了传统聚类算法无法适配处理时空数据的缺点,算法能够有效排除基站漂移对用户定位判断的干扰,提高了用户驻留点位置及停留起止时间识别精度。客观还原了用户停留位置,并得出用户进入和离开的时刻,解决了由于手机信令数据回传延迟和位置漂移带来的停留位置准确性低的问题。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述S1对所述原始轨迹数据进行清洗处理的具体方法包括:
S11,去除所述原始轨迹数据中的重复数据和字段缺失数据,得到过滤数据;
S12,将所述过滤数据进行去噪处理,得到去噪数据;
S13,将所述去噪数据按时间先后顺序进行升序排练,得到排序数据;
S14,将所述排序数据进行空间关联,得到所述初步轨迹数据。
采用上述进一步方案的有益效果是通过对数据进行清洗,过滤掉重复、错误的数据,进而保证最终得到用户停留位置的准确性。
进一步,所述S4中校验每个所述第二位置点的具体方法为:
当所述手机信令数据的获取频率大于或等于预设频率值时,按以下步骤实施:
S41,按时间升序排列所述第二位置点,得到第二位置点集D1,D2,D3,……,Dn,……Dm;其中,1≤n≤m;
S42,取Dn后与Dn间隔时间为t的Dnt,计算Dn与Dnt之间的距离,若所述Dn与Dnt之间的距离大于或等于预设阈值L2,则Dn与Dnt确定为相互分离;否则Dn至Dnt合并形成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dnt=Dm;
其中,S42还包括以下步骤:
S421,当Dn与Dnt确定为相互分离,则计算Dn与Dnt-1的距离,若所述Dn与Dnt-1之间的距离大于或等于预设阈值S,则Dn与Dnt-1确定为相互分离,否则Dn至Dnt-1合并形成新的第二位置点;重复上述步骤,直至Dnt-1=Dn+1;
当所述手机信令数据的获取频率小于预设频率值时,将所述第二位置点按照时间升序进行编号,得到D1`,D2`,D3`,……,Dn`,……Dm`;其中,1≤n≤m;
取Dn`相邻的后一位Dn+1`,计算Dn+1`与Dn`之间的距离,若Dn+1`与Dn`之间的距离大于或等于预设阈值L2,则Dn+1`与Dn`相互分离,否则Dn+1`与Dn`相互合并组成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dn+1`=Dm`。
采用上述进一步方案的有益效果是通过上述步骤的数据校验,可以有效
进一步,还包括步骤S7,以多个所述用户停留位置形成用户停留区域,校验所述用户进入所述用户停留区域的进入时间和所述用户离开所述用户离开所述用户停留区域的离开时间。
本发明解决上述技术问题的技术方案如下:一种基于手机信令的用户停留位置发现系统,包括:
数据清洗模块,用于将获取到的用户的手机信令数据作为原始轨迹数据,并对所述原始轨迹数据进行清洗处理,得到初步轨迹数据;
数据切片模块,用于将所述初步轨迹数据按照预设的时间间隔进行切片,得到多个轨迹片段,并将每个所述轨迹片段分别进行空间聚合,得到与每个所述轨迹片对应的第一位置点,并对所述第一位置点按照切片时间升序进行编号;
初步类聚模块,用于将所述第一位置点按照编号从小到大的顺序进行初步类聚,通过所述初步类聚,将相邻的所述第一位置点之间的距离小于预设阈值L1的两个所述第一位置点聚合为一个第一位置点组,以此类推,得到多个第一位置点组;将每个所述第一位置点组均进行几何中心计算,得到与每个所述第一位置点组对应的第二位置点;
校验模块,用于按照时间升序排列所述第二位置点,以第一个所述第二位置点作为参照点,按照排列顺依次校验所述参考点后的第二位置点;
若校验出不合格的第二位置点,则将所述不合格的第二位置点与所述参照点进行合并,得到新的第二位置点,并以所述新的第二位置点后一位的第二位置点作为新的参照点;
若检验出合格的第二位置点,则将所述合格的第二位置点进行保留并以所述合格的第二位置点的后一个第二位置点作为新的参照点,并将所述第一个所述第二位置点也作为所述合格的第二位置点;
以此类推,将所述新的第二位置点和所述合格的第二位置点作为初步停留点;
核心簇生成模块,用于通过DBSAN-基于密度聚类算法将所述初步停留点划分为多个簇,计算每个所述簇中初步停留点对应时间的累加值,选取出累加值大于或等于累加值阈值的簇作为停留核心簇;
用户停留位置生成模块,用于获取每个所述停留核心簇的空间平均位置,以所述停留核心簇的空间平均位置作为用户停留位置。
进一步,所述清洗模块包括:
过滤模块,用于去除所述原始轨迹数据中的重复数据和字段缺失数据,得到过滤数据;
去噪模块,用于将所述过滤数据进行去噪处理,得到去噪数据;
排序模块,将所述去噪数据按时间先后顺序进行升序排练,得到排序数据;
空间关联模块,用于将所述排序数据进行空间关联,得到所述初步轨迹数据。
进一步,所述校验模块还用于:当所述手机信令数据的获取频率大于或等于预设频率值时,按时间升序排列所述第二位置点,得到第二位置点集D1,D2,D3,……,Dn,……Dm;其中,1≤n≤m;
取Dn后与Dn间隔时间为t的Dnt,计算Dn与Dnt之间的距离,若所述Dn与Dnt之间的距离大于或等于预设阈值L2,则Dn与Dnt确定为相互分离;否则Dn至Dnt合并形成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dnt=Dm;
其中,当Dn与Dnt确定为相互分离,则计算Dn与Dnt-1的距离,若所述Dn与Dnt-1之间的距离大于或等于预设阈值S,则Dn与Dnt-1确定为相互分离,否则Dn至Dnt-1合并形成新的第二位置点;重复上述步骤,直至Dnt-1=Dn+1;
当所述手机信令数据的获取频率小于预设频率值时,将所述第二位置点按照时间升序进行编号,得到D1`,D2`,D3`,……,Dn`,……Dm`;其中,1≤n≤m;
取Dn`相邻的后一位Dn+1`,计算Dn+1`与Dn`之间的距离,若Dn+1`与Dn`之间的距离大于或等于预设阈值L2,则Dn+1`与Dn`相互分离,否则Dn+1`与Dn`相互合并组成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dn+1`=Dm`。
进一步,所述系统还包括时间校验模块,所述时间校验模块用于以多个所述用户停留位置形成用户停留区域,校验所述用户进入所述用户停留区域的进入时间和所述用户离开所述用户离开所述用户停留区域的离开时间。
附图说明
图1为本发明的方法流程图;
图2为本发明的数据清洗的方法流程图;
图3为本发明的系统原理框图;
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,本发明实施例提供的一种基于手机信令的用户停留位置发现方法,包括以下几个步骤:
S1,将获取到的用户的手机信令数据作为原始轨迹数据,并对原始轨迹数据进行清洗处理,得到初步轨迹数据;
S2,将初步轨迹数据按照预设的时间间隔进行切片,得到多个轨迹片段,并将每个轨迹片段分别进行空间聚合,得到与每个轨迹片对应的第一位置点,并对第一位置点按照切片时间升序进行编号;
S3,将第一位置点按照编号从小到大的顺序进行初步类聚,通过初步类聚,将相邻的第一位置点之间的距离小于预设阈值L1的两个第一位置点聚合为一个第一位置点组,以此类推,得到多个第一位置点组;将每个第一位置点组均进行几何中心计算,得到与每个第一位置点组对应的第二位置点;
S4,按照时间升序排列第二位置点,以第一个第二位置点作为参照点,按照排列顺依次校验参考点后的第二位置点;
若校验出不合格的第二位置点,则将不合格的第二位置点与参照点进行合并,得到新的第二位置点,并以新的第二位置点后一位的第二位置点作为新的参照点;
若检验出合格的第二位置点,则将合格的第二位置点进行保留并以合格的第二位置点的后一个第二位置点作为新的参照点,并将第一个第二位置点也作为合格的第二位置点;
以此类推,将新的第二位置点和合格的第二位置点作为初步停留点;
S5,通过DBSAN-基于密度聚类算法将初步停留点划分为多个簇,计算每个簇中初步停留点对应时间的累加值,选取出累加值大于或等于累加值阈值的簇作为停留核心簇;
S6,获取每个停留核心簇的空间平均位置,以停留核心簇的空间平均位置作为用户停留位置。
在实际应用场景中,通过检测区域中已经设置的多个基站获取用户的手机信令数据,该手机信令数据能够反映用户在一定时间内的多个离散的停留点位,这些停留点位构成了用户在这段时间内的一个大致行动轨迹即原始轨迹数据,由于原始轨迹数据采集较为粗略,因此会引入冗余或者错误的数据,此时需要对原始轨迹数据进行清理。
具体地,如图2所示:在S1对原始轨迹数据进行清洗处理的具体方法为:
S11,去除原始轨迹数据中的重复数据和字段缺失数据,得到过滤数据;
S12,将过滤数据进行去噪处理,得到去噪数据,具体地,例如若前后过滤数据对应位置点的位移距离超过10km,并且下一个过滤数据的对应位置点回到长距离位移前一个过滤数据的对应点的临近区域2km以内,认为该长距离位移轨迹为噪声位置,并剔除。
S13,将去噪数据按时间先后顺序进行升序排练,得到排序数据;
S14,将排序数据进行空间关联,得到初步轨迹数据,具体地,将采集该排序数据的基站编号与参与到本次采集的所有基站的基站维表进行关联,以得到初步轨迹数据。
需要说明的是,若是针对于多个用户的停留位置发现,可在S11和S12之间增加一个用户分组的步骤,以方便后续的数据划分和处理。
随后,按S2,将初步轨迹数据按照预设的时间间隔进行切片,得到多个轨迹片段,例如:以5分钟为单元对初步轨迹数据进行切片,将用户全天的初步轨迹数据分成288个片段,并将每个轨迹片段分别进行空间聚合,得到与每个轨迹片对应的第一位置点。
然后,对第一位置点进行初步类聚,在初步类聚时,先对第一位置点按照时间升序进行编号,再计算相邻第一位置点间距,大于1km的间隔判定为切分点,使用切分点把第一位置点的切片序列划分成若干组即第一点位组。分组后的结果即是初步聚类结果,计算每组的几何中心,得到与每组对应的第二位置点,并标记每个第二位置点序号。
接下来,为了验证初次聚类结果是否存在错误的切分,比如发生较长距离的信号飘移,错误的切分需要合并,真实的发生位移产生的切分则保留。利用上一步的初步聚类结果进行跳跃检测。其中有两种情况:
一种是在手机信令获取间隔密集时。按照时间升序顺序遍历每一个第二位置点,记当前遍历点为搜索点,按照搜索点20min时间间隔向后取最后一点记为对比点。计算搜索点与对比点的间距,如果距离大于0.5km则倒序依次遍历,如果遇到搜索点与对比带你的间距小于0.5km,则合并搜索点与对比点之间的所有点为切分点校核后的新的第二位置点,如果不存在,则搜索点向后移动一个点,重复上述校核步骤。
一种是在手机信令获取间隔稀疏时。按照初次聚类第二位置点的序号升序顺序遍历每一带你,记当前遍历点为搜索点,按照搜索点序号值向后取第二个第二位置点记为对比点。计算搜索点与对比点的间距,如果距离大于0.5km则倒序依次遍历,如果遇到搜索点与对比点的间距小于0.5km,则合并搜索点与对比点之间的所有第二位置点为切分点校核后的新的第二位置点,如果不存在则搜索点向后移动一个点,重复上述校核步骤。
为了更好的说明本校验方法,具体校验时,当手机信令数据的获取频率大于或等于预设频率值时,可按以下步骤实施:
S41,按时间升序排列第二位置点,得到第二位置点集D1,D2,D3,……,Dn,……Dm;其中,1≤n≤m;
S42,取Dn后与Dn间隔时间为t的Dnt,其中,nt为1到n之间的整数,再计算Dn与Dnt之间的距离,若Dn与Dnt之间的距离大于或等于预设阈值L2,则Dn与Dnt确定为相互分离;否则Dn至Dnt合并形成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dnt=Dm;
其中,S42还包括以下步骤:
S421,当Dn与Dnt确定为相互分离,则计算Dn与Dnt-1的距离,若Dn与Dnt-1之间的距离大于或等于预设阈值S,则Dn与Dnt-1确定为相互分离,否则Dn至Dnt-1合并形成新的第二位置点;重复上述步骤,直至Dnt-1=Dn+1;
当手机信令数据的获取频率小于预设频率值时,将第二位置点按照时间升序进行编号,得到D1`,D2`,D3`,……,Dn`,……Dm`;其中,1≤n≤m;
取Dn、相邻的后一位Dn+1`,计算Dn+1`与Dn`之间的距离,若Dn+1`与Dn`之间的距离大于或等于预设阈值L2,则Dn+1`与Dn`相互分离,否则Dn+1`与Dn`相互合并组成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dn+1`=Dm`。
其中,预设阈值L2取值为0.5km-1.5km。
然后再对校验后得到的新的第二位置点进行核心簇计算,在上一步的结果中得到的新的第二位置点即初步停留点,采用DBSAN-基于密度聚类算法对其进行计算,依次从初步停留点中的每一个点出发,以半径0.5km遍历组中后续初步停留点,如遇到超过该半径阈值的轨迹点则停止,根据此算法将初步停留点划分为若干簇。计算所有簇的累加时间,以累加时间值做权重,选取较大的累加时间值的簇为停留核心簇,停留核心簇的空间平均位置为用户停留位置。
最后,为了方便对用户停留位置发现做更深入的分析,以多个用户停留位置形成用户停留区域,还需获取用户进入用户停留区域的进入时间,和离开用户停留区域的离开时间,由于原始的轨迹数据已经过清洗、类聚等一系列处理,在该用户停留区域采集的首个的原始轨迹数据的位置点可能已经不对应该用户停留区的进入时间,同理离开时间也可能发生改变。因此需要校验用户进入用户停留区域的进入时间和用户离开用户停留区域的离开时间。
具体地,分别顺序和逆序依次检测用户停留位置的边缘轨迹与用户停留位置间的距离,如果该轨迹与停留位置距离小于0.5km则停止该方向的检测,取最终检测得到的,用户停留区域的首末用户停留位置点的对应时间分别为用户停留位置进入、离开时间。
如图3所示:本实施例还提供一种基于手机信令的用户停留位置发现系统,包括:
数据清洗模块,用于将获取到的用户的手机信令数据作为原始轨迹数据,并对原始轨迹数据进行清洗处理,得到初步轨迹数据;
数据切片模块,用于将初步轨迹数据按照预设的时间间隔进行切片,得到多个轨迹片段,并将每个轨迹片段分别进行空间聚合,得到与每个轨迹片对应的第一位置点,并对第一位置点按照切片时间升序进行编号;
初步类聚模块,用于将第一位置点按照编号从小到大的顺序进行初步类聚,通过初步类聚,将相邻的第一位置点之间的距离小于预设阈值L1的两个第一位置点聚合为一个第一位置点组,以此类推,得到多个第一位置点组;将每个第一位置点组均进行几何中心计算,得到与每个第一位置点组对应的第二位置点;
校验模块,用于按照时间升序排列第二位置点,以第一个第二位置点作为参照点,按照排列顺依次校验参考点后的第二位置点;
若校验出不合格的第二位置点,则将不合格的第二位置点与参照点进行合并,得到新的第二位置点,并以新的第二位置点后一位的第二位置点作为新的参照点;
若检验出合格的第二位置点,则将合格的第二位置点进行保留并以合格的第二位置点的后一个第二位置点作为新的参照点,并将第一个第二位置点也作为合格的第二位置点;
以此类推,将新的第二位置点和合格的第二位置点作为初步停留点;
核心簇生成模块,用于通过DBSAN-基于密度聚类算法将初步停留点划分为多个簇,计算每个簇中初步停留点对应时间的累加值,选取出累加值大于或等于累加值阈值的簇作为停留核心簇;
用户停留位置生成模块,用于获取每个停留核心簇的空间平均位置,以停留核心簇的空间平均位置作为用户停留位置。
优选地,清洗模块包括:
过滤模块,用于去除原始轨迹数据中的重复数据和字段缺失数据,得到过滤数据;
去噪模块,用于将过滤数据进行去噪处理,得到去噪数据;
排序模块,将去噪数据按时间先后顺序进行升序排练,得到排序数据;
空间关联模块,用于将排序数据进行空间关联,得到初步轨迹数据。
优选地,校验模块还用于:当手机信令数据的获取频率大于或等于预设频率值时,按时间升序排列第二位置点,得到第二位置点集D1,D2,D3,……,Dn,……Dm;其中,1≤n≤m;
取Dn后与Dn间隔时间为t的Dnt,计算Dn与Dnt之间的距离,若Dn与Dnt之间的距离大于或等于预设阈值L2,则Dn与Dnt确定为相互分离;否则Dn至Dnt合并形成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dnt=Dm;
其中,当Dn与Dnt确定为相互分离,则计算Dn与Dnt-1的距离,若Dn与Dnt-1之间的距离大于或等于预设阈值S,则Dn与Dnt-1确定为相互分离,否则Dn至Dnt-1合并形成新的第二位置点;重复上述步骤,直至Dnt-1=Dn+1;
当手机信令数据的获取频率小于预设频率值时,将第二位置点按照时间升序进行编号,得到D1`,D2`,D3`,……,Dn`,……Dm`;其中,1≤n≤m;
取Dn`相邻的后一位Dn+1`,计算Dn+1`与Dn`之间的距离,若Dn+1`与Dn`之间的距离大于或等于预设阈值L2,则Dn+1`与Dn`相互分离,否则Dn+1`与Dn`相互合并组成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dn+1`=Dm`。
优选地,系统还包括时间校验模块,时间校验模块用于以多个用户停留位置形成用户停留区域,校验用户进入用户停留区域的进入时间和用户离开用户停留区域的离开时间。
综上所述,上述实施例提供的技术方案通过采用了轨迹切片聚合、层次聚类算法、核密度聚类算法、机器学习算法等一系列算法,综合考虑手机轨点密度、信令时间间隔、轨迹点移动方向和移动距离等指标,判断用户停留位置、停留时长、进入和离开停留点时刻。解决了传统聚类算法无法适配处理时空数据的缺点,算法能够有效排除基站漂移对用户定位判断的干扰,提高了用户驻留点位置及停留起止时间识别精度。客观还原了用户停留位置,并得出用户进入和离开的时刻,解决了由于手机信令数据回传延迟和位置漂移带来的停留位置准确性低的问题。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于手机信令的用户停留位置发现方法,其特征在于,包括以下几个步骤:
S1,将获取到的用户的手机信令数据作为原始轨迹数据,并对所述原始轨迹数据进行清洗处理,得到初步轨迹数据;
S2,将所述初步轨迹数据按照预设的时间间隔进行切片,得到多个轨迹片段,并将每个所述轨迹片段分别进行空间聚合,得到与每个所述轨迹片对应的第一位置点,并对所述第一位置点按照切片时间升序进行编号;
S3,将所述第一位置点按照编号从小到大的顺序进行初步类聚,通过所述初步类聚,将相邻的所述第一位置点之间的距离小于预设阈值L1的两个所述第一位置点聚合为一个第一位置点组,以此类推,得到多个第一位置点组;将每个所述第一位置点组均进行几何中心计算,得到与每个所述第一位置点组对应的第二位置点;
S4,按照时间升序排列所述第二位置点,以第一个所述第二位置点作为参照点,按照排列顺依次校验所述参照点后的第二位置点;其中,校验每个所述第二位置点的具体方法为:
当所述手机信令数据的获取频率大于或等于预设频率值时,按以下步骤实施:
S41,按时间升序排列所述第二位置点,得到第二位置点集D1,D2,D3,……,Dn,……Dm;其中,1≤n≤m;
S42,取Dn后与Dn间隔时间为t的Dnt,计算Dn与Dnt之间的距离,若所述Dn与Dnt之间的距离大于或等于预设阈值L2,则Dn与Dnt确定为相互分离;否则Dn至Dnt合并形成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dnt=Dm;
其中,S42还包括以下步骤:
S421,当Dn与Dnt确定为相互分离,则计算Dn与Dnt-1的距离,若所述Dn与Dnt-1之间的距离大于或等于预设阈值S,则Dn与Dnt-1确定为相互分离,否则Dn至Dnt-1合并形成新的第二位置点;重复上述步骤,直至Dnt-1=Dn+1;
当所述手机信令数据的获取频率小于预设频率值时,将所述第二位置点按照时间升序进行编号,得到D1`,D2`,D3`,……,Dn`,……Dm`;其中,1≤n≤m;
取Dn`相邻的后一位Dn+1`,计算Dn+1`与Dn`之间的距离,若Dn+1`与Dn`之间的距离大于或等于预设阈值L2,则Dn+1`与Dn`相互分离,否则Dn+1`与Dn`相互合并组成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dn+1`=Dm`;若校验出不合格的第二位置点,则将所述不合格的第二位置点与所述参照点进行合并,得到新的第二位置点,并以所述新的第二位置点后一位的第二位置点作为新的参照点;
若检验出合格的第二位置点,则将所述合格的第二位置点进行保留并以所述合格的第二位置点的后一个第二位置点作为新的参照点,并将所述第一个所述第二位置点也作为所述合格的第二位置点;
以此类推,将所述新的第二位置点和所述合格的第二位置点作为初步停留点;
S5,通过DBSAN-基于密度聚类算法将所述初步停留点划分为多个簇,计算每个所述簇中初步停留点对应时间的累加值,选取出累加值大于或等于累加值阈值的簇作为停留核心簇;
S6,获取每个所述停留核心簇的空间平均位置,以所述停留核心簇的空间平均位置作为用户停留位置。
2.根据权利要求1所述一种基于手机信令的用户停留位置发现方法,其特征在于,所述S1对所述原始轨迹数据进行清洗处理的具体方法包括:
S11,去除所述原始轨迹数据中的重复数据和字段缺失数据,得到过滤数据;
S12,将所述过滤数据进行去噪处理,得到去噪数据;
S13,将所述去噪数据按时间先后顺序进行升序排练,得到排序数据;
S14,将所述排序数据进行空间关联,得到所述初步轨迹数据。
3.根据权利要求1或2所述一种基于手机信令的用户停留位置发现方法,其特征在于,还包括步骤S7,以多个所述用户停留位置形成用户停留区域,校验所述用户进入所述用户停留区域的进入时间和所述用户离开所述用户离开所述用户停留区域的离开时间。
4.一种基于手机信令的用户停留位置发现系统,其特征在于,包括:
数据清洗模块,用于将获取到的用户的手机信令数据作为原始轨迹数据,并对所述原始轨迹数据进行清洗处理,得到初步轨迹数据;
数据切片模块,用于将所述初步轨迹数据按照预设的时间间隔进行切片,得到多个轨迹片段,并将每个所述轨迹片段分别进行空间聚合,得到与每个所述轨迹片对应的第一位置点,并对所述第一位置点按照切片时间升序进行编号;
初步类聚模块,用于将所述第一位置点按照编号从小到大的顺序进行初步类聚,通过所述初步类聚,将相邻的所述第一位置点之间的距离小于预设阈值L1的两个所述第一位置点聚合为一个第一位置点组,以此类推,得到多个第一位置点组;将每个所述第一位置点组均进行几何中心计算,得到与每个所述第一位置点组对应的第二位置点;
校验模块,用于按照时间升序排列所述第二位置点,以第一个所述第二位置点作为参照点,按照排列顺依次校验所述参照点后的第二位置点;所述校验模块还用于:当所述手机信令数据的获取频率大于或等于预设频率值时,按时间升序排列所述第二位置点,得到第二位置点集D1,D2,D3,……,Dn,……Dm;其中,1≤n≤m;
取Dn后与Dn间隔时间为t的Dnt,计算Dn与Dnt之间的距离,若所述Dn与Dnt之间的距离大于或等于预设阈值L2,则Dn与Dnt确定为相互分离;否则Dn至Dnt合并形成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dnt=Dm;
其中,当Dn与Dnt确定为相互分离,则计算Dn与Dnt-1的距离,若所述Dn与Dnt-1之间的距离大于或等于预设阈值S,则Dn与Dnt-1确定为相互分离,否则Dn至Dnt-1合并形成新的第二位置点;重复上述步骤,直至Dnt-1=Dn+1;
当所述手机信令数据的获取频率小于预设频率值时,将所述第二位置点按照时间升序进行编号,得到D1`,D2`,D3`,……,Dn`,……Dm`;其中,1≤n≤m;
取Dn`相邻的后一位Dn+1`,计算Dn+1`与Dn`之间的距离,若Dn+1`与Dn`之间的距离大于或等于预设阈值L2,则Dn+1`与Dn`相互分离,否则Dn+1`与Dn`相互合并组成新的第二位置点,其中从n=1开始选取,重复上述步骤,直至Dn+1`=Dm`;
若校验出不合格的第二位置点,则将所述不合格的第二位置点与所述参照点进行合并,得到新的第二位置点,并以所述新的第二位置点后一位的第二位置点作为新的参照点;
若检验出合格的第二位置点,则将所述合格的第二位置点进行保留并以所述合格的第二位置点的后一个第二位置点作为新的参照点,并将所述第一个所述第二位置点也作为所述合格的第二位置点;
以此类推,将所述新的第二位置点和所述合格的第二位置点作为初步停留点;
核心簇生成模块,用于通过DBSAN-基于密度聚类算法将所述初步停留点划分为多个簇,计算每个所述簇中初步停留点对应时间的累加值,选取出累加值大于或等于累加值阈值的簇作为停留核心簇;
用户停留位置生成模块,用于获取每个所述停留核心簇的空间平均位置,以所述停留核心簇的空间平均位置作为用户停留位置。
5.根据权利要求4所述一种基于手机信令的用户停留位置发现系统,其特征在于,所述清洗模块包括:
过滤模块,用于去除所述原始轨迹数据中的重复数据和字段缺失数据,得到过滤数据;
去噪模块,用于将所述过滤数据进行去噪处理,得到去噪数据;
排序模块,将所述去噪数据按时间先后顺序进行升序排练,得到排序数据;
空间关联模块,用于将所述排序数据进行空间关联,得到所述初步轨迹数据。
6.根据权利要求4或5所述一种基于手机信令的用户停留位置发现系统,其特征在于,还包括时间校验模块,所述时间校验模块用于以多个所述用户停留位置形成用户停留区域,校验所述用户进入所述用户停留区域的进入时间和所述用户离开所述用户离开所述用户停留区域的离开时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810671489.3A CN109104694B (zh) | 2018-06-26 | 2018-06-26 | 一种基于手机信令的用户停留位置发现方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810671489.3A CN109104694B (zh) | 2018-06-26 | 2018-06-26 | 一种基于手机信令的用户停留位置发现方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109104694A CN109104694A (zh) | 2018-12-28 |
CN109104694B true CN109104694B (zh) | 2020-10-30 |
Family
ID=64845074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810671489.3A Active CN109104694B (zh) | 2018-06-26 | 2018-06-26 | 一种基于手机信令的用户停留位置发现方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109104694B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110274601B (zh) * | 2019-06-05 | 2021-06-11 | 上海易点时空网络有限公司 | 通过行车轨迹获取违章地点经纬度的方法及装置 |
CN110312206A (zh) * | 2019-06-19 | 2019-10-08 | 同济大学 | 基于动态空间阈值改进的手机信令数据出行识别方法 |
CN110704612B (zh) * | 2019-08-09 | 2022-09-16 | 国家计算机网络与信息安全管理中心 | 一种社交群体发现方法、装置和存储介质 |
CN110728433B (zh) * | 2019-09-19 | 2023-05-26 | 重庆市交通规划研究院 | 一种基于手机信令的地块居住人口测算方法 |
CN111090642B (zh) * | 2019-12-02 | 2023-07-14 | 杭州诚智天扬科技有限公司 | 一种手机信令数据的清洗方法 |
CN111144452B (zh) * | 2019-12-11 | 2022-10-25 | 重庆邮电大学 | 一种基于信令数据和聚类算法的移动用户出行链提取方法 |
CN111182530B (zh) * | 2019-12-27 | 2022-05-13 | 南京中新赛克科技有限责任公司 | 基于手机信令数据分析目标新手机号码的方法及系统 |
CN111191147B (zh) * | 2020-04-09 | 2020-08-21 | 南京柏跃软件有限公司 | 一种基于大数据挖掘的群体发现方法及分析系统 |
CN111578933B (zh) * | 2020-05-09 | 2022-03-11 | 北京上下文系统软件有限公司 | 一种快速识别用户进入特定地理区域内的方法 |
CN111680102B (zh) * | 2020-05-21 | 2023-12-26 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的定位数据处理方法及相关设备 |
CN111625610A (zh) * | 2020-05-25 | 2020-09-04 | 重庆大学 | 一种基于定位点生成轨迹的显示方法及系统 |
CN111770452B (zh) * | 2020-05-27 | 2021-06-01 | 中山大学 | 一种基于个人出行轨迹特征的手机信令停留点识别方法 |
CN113923602B (zh) * | 2020-07-10 | 2023-09-19 | 中国移动通信集团浙江有限公司 | 信令漂移数据的过滤方法及装置 |
CN112434225B (zh) * | 2020-12-13 | 2022-06-21 | 天津市赛英工程建设咨询管理有限公司 | 一种基于过程聚类的手机信令驻留点提取方法 |
WO2022193170A1 (zh) * | 2021-03-17 | 2022-09-22 | 中国科学院深圳先进技术研究院 | 一种针对手机信令数据的停留识别评估方法、系统、终端以及存储介质 |
CN113207169B (zh) * | 2021-03-26 | 2022-08-05 | 福建新大陆软件工程有限公司 | 一种基于多源异构数据的融合定位方法 |
CN113096785B (zh) * | 2021-04-09 | 2022-01-25 | 中南林业科技大学 | 一种疫情时期医疗资源分配方法 |
CN114141014B (zh) * | 2021-11-30 | 2023-04-18 | 中寰卫星导航通信有限公司 | 一种停车场的确定方法、装置、设备及存储介质 |
CN114722891A (zh) * | 2022-02-11 | 2022-07-08 | 杭州致成电子科技有限公司 | 一种台区状态分类方法 |
CN114509076B (zh) * | 2022-02-16 | 2023-10-20 | 平安科技(深圳)有限公司 | 移动轨迹数据处理方法、装置、设备及存储介质 |
CN116828397B (zh) * | 2023-08-29 | 2023-11-28 | 中国信息通信研究院 | 一种轨迹信息的获取方法、装置、电子设备和存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102607553A (zh) * | 2012-03-06 | 2012-07-25 | 北京建筑工程学院 | 一种基于出行轨迹数据的行程识别方法 |
CN104239556A (zh) * | 2014-09-25 | 2014-12-24 | 西安理工大学 | 基于密度聚类的自适应轨迹预测方法 |
CN105760780A (zh) * | 2016-02-29 | 2016-07-13 | 福建师范大学 | 基于路网的轨迹数据隐私保护方法 |
CN106912015A (zh) * | 2017-01-10 | 2017-06-30 | 上海云砥信息科技有限公司 | 一种基于移动网络数据的人员出行链识别方法 |
CN107770744A (zh) * | 2017-09-18 | 2018-03-06 | 上海世脉信息科技有限公司 | 大数据环境下出行od节点识别和节点间路径提取方法 |
CN107845260A (zh) * | 2017-10-26 | 2018-03-27 | 杭州东信北邮信息技术有限公司 | 一种用户公交出行方式的识别方法 |
-
2018
- 2018-06-26 CN CN201810671489.3A patent/CN109104694B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102607553A (zh) * | 2012-03-06 | 2012-07-25 | 北京建筑工程学院 | 一种基于出行轨迹数据的行程识别方法 |
CN104239556A (zh) * | 2014-09-25 | 2014-12-24 | 西安理工大学 | 基于密度聚类的自适应轨迹预测方法 |
CN105760780A (zh) * | 2016-02-29 | 2016-07-13 | 福建师范大学 | 基于路网的轨迹数据隐私保护方法 |
CN106912015A (zh) * | 2017-01-10 | 2017-06-30 | 上海云砥信息科技有限公司 | 一种基于移动网络数据的人员出行链识别方法 |
CN107770744A (zh) * | 2017-09-18 | 2018-03-06 | 上海世脉信息科技有限公司 | 大数据环境下出行od节点识别和节点间路径提取方法 |
CN107845260A (zh) * | 2017-10-26 | 2018-03-27 | 杭州东信北邮信息技术有限公司 | 一种用户公交出行方式的识别方法 |
Non-Patent Citations (1)
Title |
---|
《基于手机信令数据的区域通道出行特征研究》;张振;《重庆交通大学硕士学位论文》;20170828;参见4.3节 * |
Also Published As
Publication number | Publication date |
---|---|
CN109104694A (zh) | 2018-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109104694B (zh) | 一种基于手机信令的用户停留位置发现方法及系统 | |
CN110839016B (zh) | 异常流量监测方法、装置、设备及存储介质 | |
CN107133318B (zh) | 一种基于手机信令数据的人口识别方法 | |
CN109635059A (zh) | 基于轨迹相似度匹配的人车关联分析方法及系统 | |
CN106575294B (zh) | 一种轨迹数据查询的方法及装置 | |
CN107945522B (zh) | 基于大数据查找嫌疑车辆的方法和系统 | |
CN107665289B (zh) | 一种运营商数据的处理方法及系统 | |
CN109977108B (zh) | 一种基于行为轨迹库的多种轨迹碰撞分析方法 | |
CN111078818B (zh) | 地址分析方法、装置、电子设备及存储介质 | |
CN110888884B (zh) | 基于geohash匹配的车码拟合方法及系统 | |
CN107341508B (zh) | 一种快速美食图片识别方法及系统 | |
CN107861957B (zh) | 一种数据分析方法及装置 | |
CN115032693B (zh) | 一种强震的前震自动识别方法及装置 | |
CN105827422A (zh) | 一种确定网元告警关联关系的方法及装置 | |
CN110517500A (zh) | 一种人车关联处理方法及装置 | |
EP2907121A1 (en) | Real-time traffic detection | |
CN109121094B (zh) | 伪码信令数据预处理与出行链识别方法 | |
CN104537356A (zh) | 利用瑞士轮排序进行步态识别的行人再标识方法和装置 | |
CN110874369A (zh) | 一种多维数据融合侦查系统及其方法 | |
CN109951804A (zh) | 一种人流量估计方法及装置 | |
CN110290467A (zh) | 停留点、商业区服务范围、影响因素的获取方法及装置 | |
CN104484330B (zh) | 基于分档关键词阈值组合评估的垃圾评论预选方法及装置 | |
Altstidl et al. | Accuracy-aware compression of channel impulse responses using deep learning | |
CN108303622A (zh) | 时延估计方法及装置 | |
CN112200832B (zh) | 一种运动轨迹数据的去噪方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |