CN112543419B - 一种基于密度聚类的用户轨迹预测方法及装置 - Google Patents
一种基于密度聚类的用户轨迹预测方法及装置 Download PDFInfo
- Publication number
- CN112543419B CN112543419B CN201910895163.3A CN201910895163A CN112543419B CN 112543419 B CN112543419 B CN 112543419B CN 201910895163 A CN201910895163 A CN 201910895163A CN 112543419 B CN112543419 B CN 112543419B
- Authority
- CN
- China
- Prior art keywords
- track
- moving
- points
- point
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/08—Testing, supervising or monitoring using real traffic
Abstract
本发明实施例提供了一种基于密度聚类的用户轨迹预测方法及系统,其中,方法包括:采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据MDT测量数据确定多个用户在预设时间段内的移动点集;采用密度聚类算法对预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇;计算每个轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率,其中,轨迹簇的中心点作为轨迹点;将每个轨迹点按照时间顺序生成轨迹点序列,并利用轨迹点序列得到用户轨迹预测模型;利用用户轨迹预测模型预测目标地理区域内的用户轨迹。本发明实施例提供的技术方案能够解决现有技术中利用场景特效分析用户密度程度的变化规律,分析效率低的问题。
Description
【技术领域】
本发明涉及通信技术领域,尤其涉及一种基于密度聚类的用户轨迹预测方法及装置。
【背景技术】
目前,移动便携设备的广泛普及、无线通信技术和全球定位技术的飞速发展,使得人们已经能够以相对低廉的代价获得大量用户实时的位置数据,各种基于位置的信息服务也越来越受到从业者的关注,用户轨迹预测技术也成为其中最受关注的热点问题之一。
在网优过程中,基于精准的位置数据可以进行用户轨迹预测,分析区域用户密度,发现网络用户聚集区域,监测人流动向,从而指导网络优化,当前采用的场景特效分析,如按照居民区、办公场所、景区等不同的场景特性,分析定义场景潮汐效应、热点时段等区域用户密度程度的变化规律,分析效率很低。
【发明内容】
有鉴于此,本发明实施例提供了一种基于密度聚类的用户轨迹预测方法及装置,用以解决现有技术中利用场景特效分析用户密度程度的变化规律,分析效率低的问题。
为了实现上述目的,根据本发明的一个方面,提供了一种基于密度聚类的用户轨迹预测方法,所述方法包括:
采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据所述MDT测量数据确定所述多个用户在所述预设时间段内的移动点集;采用密度聚类算法对所述预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇;计算每个所述轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率,其中,所述轨迹簇的中心点作为所述轨迹点;将每个所述轨迹点按照时间顺序生成轨迹点序列,并利用所述轨迹点序列得到用户轨迹预测模型;利用所述用户轨迹预测模型预测所述目标地理区域内的用户轨迹。
可选地,所述采用密度聚类算法对所述预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇的步骤,包括:
设定密度选择参数,所述密度选择参数包括邻域的预定半径和每个轨迹点至少包含的其他移动点的个数为所述预设个数;根据所设定的密度选择参数设定轨迹点的设定条件,根据所述设定条件确定移动点中的轨迹点,通过所述轨迹点确定轨迹簇。
可选地,所述根据所设定的密度选择参数设定轨迹点的设定条件,根据所述设定条件确定移动点中的轨迹点,通过轨迹点确定轨迹簇的步骤,包括:
在所述移动点集中随机抽取一个未被分类的移动点为圆心,以所述预定半径确定所述移动点的邻域;判断未被分类的移动点的邻域内是否至少包含预设个数的移动点,若是,则确认所述未被分类的移动点是轨迹点;根据确定的轨迹点确定轨迹簇。
可选地,所述采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据所述MDT测量数据确定所述多个用户在所述预设时间段内的移动点集的步骤,包括:
根据预设的分割规则及栅格划分精度将所述目标地理区域划分为多个栅格,其中,每个栅格包括栅格编码;采集所述目标地理区域在各个预设时间段内的多个用户的MDT测量数据;采用预设的定位算法将各个所述MDT测量数据进行定位,得到各个所述移动点的定位信息;根据已划分的所述多个栅格和所有所述移动点的定位信息,定位各个所述移动点所处的栅格;将所述移动点所处的栅格的栅格编码作为所述移动点的定位信息;按照用户维度对所述预设时间段内的移动点进行汇总,得到移动点集。
可选地,在所述按照用户维度对所述预设时间段内的移动点进行汇总,得到移动点集之后,所述方法还包括:
按照预设的过滤规则过滤掉所述移动点集中的无效数据。
可选地,所述计算每个所述轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率的步骤,包括:
可选地,所述利用所述用户轨迹预测模型预测所述目标地理区域内的用户轨迹的步骤,包括:
获取待预测的某一时间段内的多个MDT测量数据,并根据所述MDT测量数据确定待预测移动点集;采用所述密度聚类算法对所述待预测移动点集中的移动点进行聚类,形成多个待预测轨迹簇;计算每个所述待预测轨迹簇的轨迹点及其影响区域;计算用户轨迹预测模型中各个预设时间段内任意一个轨迹点与所述待预测轨迹簇的轨迹点之间的欧氏距离;选择欧氏距离最小的轨迹簇的用户密度作为所述待预测轨迹簇的用户密度。
为了实现上述目的,根据本发明的一个方面,提供了一种基于密度聚类的用户轨迹预测装置,所述装置包括:采集单元,用于采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据所述MDT测量数据确定所述多个用户在所述预设时间段内的移动点集;聚类单元,用于采用密度聚类算法对所述预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇;计算单元,用于计算每个所述轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率,其中,所述轨迹簇的中心点作为所述轨迹点;生成单元,用于将每个所述轨迹点按照时间顺序生成轨迹点序列,并利用所述轨迹点序列得到用户轨迹预测模型;预测单元,用于利用所述用户轨迹预测模型预测所述目标地理区域内的用户轨迹。
为了实现上述目的,根据本发明的一个方面,提供了一种电子设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行上述的基于密度聚类的用户轨迹预测方法。
为了实现上述目的,根据本发明的一个方面,提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述的基于密度聚类的用户轨迹预测方法。
在本方案中,通过采集用户的MDT测量数据,从MDT测量数据用户的位置数据,即移动点,通过密度聚类实现轨迹预测,以随着用户MDT测量数据的增长实现动态更新,并且在完全自适应的情形下,提高用户轨迹分析的效率,且具有较高的预测准确度。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供的一种基于密度聚类的用户轨迹预测方法的流程图;
图2是本发明实施例提供的一种基于密度聚类的用户轨迹预测装置的功能框图;
图3是本发明实施例提供的一种可选的电子设备的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述终端,但这些终端不应限于这些术语。这些术语仅用来将终端彼此区分开。例如,在不脱离本发明实施例范围的情况下,第一终端也可以被称为第二终端,类似地,第二终端也可以被称为第一终端。
本发明实施例可以适用于5G系统中;也可以适用于其他无线通信系统,例如长期演进(Long Term Evolution,LTE)系统,全球移动通信系统(Global System for MobileCommunication,GSM),移动通信系统(Universal Mobile Telecommunications System,UMTS),码分多址接入(Code Division Multiple Access,CDMA)系统,以及新的网络设备系统等。
本发明实施例涉及的用户终端,可以是指向用户提供语音和/或数据连通性的设备,具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。无线用户设备可以经无线接入网(Radio Access Network,RAN)与一个或多个核心网进行通信,无线用户设备可以是移动终端,如移动电话(或称为“蜂窝”电话)和具有移动终端的计算机,例如,可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语言和/或数据。例如,个人通信业务(Personal Communication Service,PCS)电话、无绳电话、会话发起协议(SIP)话机、无线本地环路(Wireless Local Loop,WLL)站、个人数字助理(Personal Digital Assistant,PDA)等设备。无线用户设备也可以称为系统、订户单元(Subscriber Unit)、订户站(Subscriber Station),移动站(Mobile Station)、移动台(Mobile)、远程站(Remote Station)、接入点(Access Point)、远程终端(RemoteTerminal)、接入终端(Access Terminal)、用户设备(User Terminal)、用户代理(UserAgent)、用户设备(User Device)。
本发明实施例所涉及网络设备可以是5G系统中的网络设备,如下一代基站(Nextgeneration Node B,gNB),还可以是全球移动通信系统(Global System for MobileCommunication,GSM)或码分多址(Code Division Multiple Access,CDMA)中的基站(BaseTransceiver Station,BTS),也可以是宽带码分多址(Wideband Code Division MultipleAccess,WCDMA)中的基站(NodeB),还可以是LTE中的演进型基站(evolutional Node B,eNB或e-NodeB),本发明实施例并不限定。
实施例1
图1是本发明实施例提供的一种基于密度聚类的用户轨迹预测方法流程图,如图1所示,方法包括:
步骤S10,采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据MDT测量数据确定多个用户在预设时间段内的移动点集;
步骤S20,采用密度聚类算法对预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇;
步骤S30,计算每个轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率,其中,轨迹簇的中心点作为轨迹点;
步骤S40,将每个轨迹点按照时间顺序生成轨迹点序列,并利用轨迹点序列得到用户轨迹预测模型;
步骤S50,利用用户轨迹预测模型预测目标地理区域内的用户轨迹。
在本方案中,通过采集用户的MDT测量数据,从MDT测量数据用户的位置数据,即移动点,通过密度聚类实现轨迹预测,以随着用户MDT测量数据的增长实现动态更新,并且在完全自适应的情形下,提高用户轨迹分析的效率,且具有较高的预测准确度。
下面对本实施例提供的图像处理方法的具体技术方案进行详细的说明。
步骤S10,采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据MDT测量数据确定多个用户在预设时间段内的移动点集。
其中,MDT数据采集主要利用网络侧向用户终端下发测量配置,在满足测量条件时触发终端测量过程,用户终端将包含经纬度信息(GPS位置信息)的测量报告数据上报给基站。移动点为用户的一个位置数据。在本实施方式中,采用MDT测量数据的精度能够达到20米,相比于MR测量数据的精准度更高,使得后期的轨迹预测的精准度也能提高。
可选地,步骤S10包括:
步骤S11,根据预设的分割规则及栅格划分精度将目标地理区域划分为多个栅格,其中,每个栅格包括栅格编码。例如将目标地理区域划分为多个栅格,例如50m*50m的栅格,或10m*10m的栅格,或20*20m的栅格,在本实施方式中,栅格为20m*20m。
步骤S12,采集目标地理区域在各个预设时间段内的多个用户的MDT测量数据。
具体地,将用户一天24小时产生的MDT数据按人们日常的作息规律划分为[0am,6am]、[6am,9am]、[9am,12am]、[12am,14pm]、[14pm,18pm]、[18pm,24pm]六个预设时间段,分别代表休息-上班-工作-下班-工作-休闲,采集用户的MDT测量数据。
步骤S13,根据已划分的多个栅格和所有移动点的定位信息,定位各个移动点所处的栅格。例如,用户a在[0am,6am]这个时间段内的移动点:(x1,y1),其中x1表示用户所在位置的经度,y1表示用户所在位置的维度,将移动点定位至划分好的某一个栅格中。
步骤S14,将移动点所处的栅格的栅格编码作为移动点的定位信息。
步骤S15,按照用户维度对预设时间段内的移动点进行汇总,得到移动点集。
在步骤S10之后,方法还包括:
按照预设的过滤规则过滤掉移动点集中的无效数据。例如,某一个用户b星期一的18点有一个位于栅格(3,8)的移动点,直至第二个星期天的上午9点在栅格(8,12)才有第二个移动点,两个移动点之间的时间间隔太长,可见该用户b不常在关注区域活动,为无效数据。
例如:对100个用户的连续7天的MDT数据进行清洗,提取有效的移动点的定位信息,如下表1所示:
表1.用户的位置信息数据表
根据已划分的多个栅格和所有移动点的定位信息,定位各个移动点所处的栅格。
表2.用户的移动点数据表
步骤S20,采用密度聚类算法对预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇。
由于不同用户使用手机的习惯不同、同一个用户在不同时间段、不同地理区域使用手机的频率也存在较大差异,而基于密度的聚类方法擅于发现任意形状、不同大小的簇并能有效地屏蔽噪声点的干扰,因此利用基于密度的聚类方法来对用户MDT数据进行分析。
在本实施方式中,采用DBSCAN聚类算法,DBSCAN聚类算法是基于一组邻域来描述移动点集的紧密程度,参数(ε,minPts)来描述邻域的移动点分布密度,假设移动点集是D=(x1,x2…xm),则DBSCAN具体的密度描述定义如下:
邻域:对于xj∈D,其ε邻域是指,移动点集D内所有与xj的距离不大于ε的子移动点集,即Nε(xi)={xi∈D|distance(xi,xj)<ε},这个移动点集的个数是|Nε(xi)|;
轨迹点:对任意一个移动点xj,如果其邻域包含的移动点个数|Nε(xi)|大于minpts,则称该移动点xj是轨迹点。
在其他实施方式中,也可以采用DBRS算法,DBRS算法是一种融合数据抽样思想的DBSCAN改进算法,抽样技术可以提高算法的执行效率。通过不断地从位置信息集合中随机抽取未被聚类的核心点进行区域查找,通过发现轨迹点的共同邻域来进行簇的合并,最终完成聚类。
步骤S21,设定密度选择参数,密度选择参数包括邻域的预定半径和每个轨迹点至少包含的其他移动点的个数为预设个数;
步骤S22,根据所设定的密度选择参数设定轨迹点的设定条件,根据设定条件确定移动点中的轨迹点,通过轨迹点确定轨迹簇。
其中,轨迹点的设定条件为:每个移动点的邻域内所包含的其他移动点的个数是否大于等于预设个数。例如预设个数为5个。
步骤S22,具体实现如下:
S221,在移动点集中随机抽取一个未被分类的移动点为圆心,以预定半径确定移动点的邻域。
在本实施方式中,预定半径可以是20m,但不限于此。
S222,判断未被分类的移动点的邻域内是否至少包含预定个数的移动点,若是,则确认未被分类的移动点是轨迹点。预定个数为5个。
在本实施方式中,设定条件为:|Nε(xj)|≥minpts,其中,N表示某一个移动点的ε邻域内的移动点个数;ε表示邻域的预定半径;xj表示第j个移动点,j表示自然数;minpts表示每个轨迹点至少包含的移动点的个数;
Nε(xj)={xi∈D|d(xi,xj)≤0},其中,xi表示第i个移动点,i表示自然数,D表示编号后的每个移动点的经纬度信息的数据集,d(xi,xj)表示xi与xj两个移动点之间的距离。
聚类过程中,每次从移动点集中随机抽取未被聚类的移动点进行邻域查找,如果第一次抽取的一个移动点p为核心点,判断核心点的邻域与已知的轨迹簇有无交集,如果没有交集,将移动点p及其邻域内的所有移动点聚为一类并分配新的轨迹簇编码C1,第二次随机抽取移动点q为核心点,发现核心点q的邻域与已知的轨迹簇仍无交集,则移动点q及其邻域内的所有移动点聚为新的一类并分配新的轨迹簇编码C2,继续迭代,直至移动点集中不再存在可将轨迹簇C1集C2合并的未分类的移动点。
可以理解地,若移动点q在另一个移动点p的预定半径内且p为轨迹点,则称移动点q从轨迹点p直接密度可达;若存在移动点o,使得移动点p和移动q都从移动o密度可达,则移动点p和移动点q密度相连;使用密度相连的闭包来发现连通的稠密区域作为簇,基于密度聚类的簇就是一组密度相连的移动点,以实现最大化的密度可达。
步骤S30,计算每个轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率,其中,轨迹簇的中心点作为轨迹点。
可以理解地,轨迹点的影响区域就是其邻域中包含的移动点。
步骤S40,将每个轨迹点按照时间顺序生成轨迹点序列,并利用轨迹点序列得到用户轨迹预测模型。
步骤S50,利用用户轨迹预测模型预测目标地理区域内的用户轨迹。
具体地,步骤S51,获取待预测的某一时间段内的多个MDT测量数据,并根据MDT测量数据确定待预测移动点集;
步骤S52,采用密度聚类算法对待预测移动点集中的移动点进行聚类,形成多个待预测轨迹簇;
步骤S53,计算每个待预测轨迹簇的轨迹点及其影响区域;
步骤S54,计算用户轨迹预测模型中各个预设时间段内任意一个轨迹点与待预测轨迹簇的轨迹点之间的欧氏距离;
步骤S55,选择欧氏距离最小的轨迹簇的用户密度作为待预测轨迹簇的用户密度。
例如:将100个用户的第8天的MDT测量数据作为测试集来验证用户轨迹预测模型的准确性。
预测结果如下:
从预测结果可以看出,除12-14点外,预测准确率达到了80%以上,12-14点休闲时间,用户活动行为具有较大随意性,使得预测结果较低。
基于用户轨迹可以预测区域用户密度,提前识别用户趋势,进行网络干预。
在本方案中,通过采集用户的MDT测量数据,从MDT测量数据用户的位置数据,即移动点,通过密度聚类实现轨迹预测,以随着用户MDT测量数据的增长实现动态更新,并且在完全自适应的情形下,提高用户轨迹分析的效率,且具有较高的预测准确度。
图2是本发明实施例提供的一种基于密度聚类的用户轨迹预测装置的功能框图,如图2所示,装置100包括:
采集单元10,用于采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据MDT测量数据确定多个用户在预设时间段内的移动点集;
聚类单元20,用于采用密度聚类算法对预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇;
计算单元30,用于计算每个轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率,其中,轨迹簇的中心点作为轨迹点;
生成单元40,用于将每个轨迹点按照时间顺序生成轨迹点序列,并利用轨迹点序列得到用户轨迹预测模型;
预测单元50,用于利用用户轨迹预测模型预测目标地理区域内的用户轨迹。
在本方案中,通过采集用户的MDT测量数据,从MDT测量数据用户的位置数据,即移动点,通过密度聚类实现轨迹预测,以随着用户MDT测量数据的增长实现动态更新,并且在完全自适应的情形下,提高用户轨迹分析的效率,且具有较高的预测准确度。
其中,MDT数据采集主要利用网络侧向用户终端下发测量配置,在满足测量条件时触发终端测量过程,用户终端将包含经纬度信息(GPS位置信息)的测量报告数据上报给基站。移动点为用户的一个位置数据。在本实施方式中,采用MDT测量数据的精度能够达到20米,相比于MR测量数据的精准度更高,使得后期的轨迹预测的精准度也能提高。
可选地,采集单元10包括划分子单元、采集子单元、定位子单元、第一确定子单元及汇总子单元。
划分子单元,用于根据预设的分割规则及栅格划分精度将目标地理区域划分为多个栅格,其中,每个栅格包括栅格编码。例如将目标地理区域划分为多个栅格,例如50m*50m的栅格,或10m*10m的栅格,或20*20m的栅格,在本实施方式中,栅格为20m*20m。
采集子单元,用于采集目标地理区域在各个预设时间段内的多个用户的MDT测量数据。
具体地,将用户一天24小时产生的MDT数据按人们日常的作息规律划分为[0am,6am]、[6am,9am]、[9am,12am]、[12am,14pm]、[14pm,18pm]、[18pm,24pm]六个预设时间段,分别代表休息-上班-工作-下班-工作-休闲,采集用户的MDT测量数据。
定位子单元,用于根据已划分的多个栅格和所有移动点的定位信息,定位各个移动点所处的栅格。例如,用户a在[0am,6am]这个时间段内的移动点:(x1,y1),其中x1表示用户所在位置的经度,y1表示用户所在位置的维度,将移动点定位至划分好的某一个栅格中。
第一确定子单元,用于将移动点所处的栅格的栅格编码作为移动点的定位信息。
汇总子单元,用于按照用户维度对预设时间段内的移动点进行汇总,得到移动点集。
可选地,装置还包括过滤单元。
过滤单元,用于按照预设的过滤规则过滤掉移动点集中的无效数据。例如,某一个用户b星期一的18点有一个位于栅格(3,8)的移动点,直至第二个星期天的上午9点在栅格(8,12)才有第二个移动点,两个移动点之间的时间间隔太长,可见该用户b不常在关注区域活动,为无效数据。
例如:对100个用户的连续7天的MDT数据进行清洗,提取有效的移动点的定位信息,如下表1所示:
表1.用户的位置信息数据表
根据已划分的多个栅格和所有移动点的定位信息,定位各个移动点所处的栅格。
表2.用户的移动点数据表
由于不同用户使用手机的习惯不同、同一个用户在不同时间段、不同地理区域使用手机的频率也存在较大差异,而基于密度的聚类方法擅于发现任意形状、不同大小的簇并能有效地屏蔽噪声点的干扰,因此利用基于密度的聚类方法来对用户MDT数据进行分析。
在本实施方式中,采用DBSCAN聚类算法,DBSCAN聚类算法是基于一组邻域来描述移动点集的紧密程度,参数(ε,minPts)来描述邻域的移动点分布密度,假设移动点集是D=(x1,x2…xm),则DBSCAN具体的密度描述定义如下:
邻域:对于xj∈D,其ε邻域是指,移动点集D内所有与xj的距离不大于ε的子移动点集,即Nε(xi)={xi∈D|distance(xi,xj)<ε},这个移动点集的个数是|Nε(xi)|;
轨迹点:对任意一个移动点xj,如果其邻域包含的移动点个数|Nε(xi)|大于minpts,则称该移动点xj是轨迹点。
在其他实施方式中,也可以采用DBRS算法,DBRS算法是一种融合数据抽样思想的DBSCAN改进算法,抽样技术可以提高算法的执行效率。通过不断地从位置信息集合中随机抽取未被聚类的核心点进行区域查找,通过发现轨迹点的共同邻域来进行簇的合并,最终完成聚类。
聚类单元20包括设定子单元、第二确定子单元。
设定子单元,用于设定密度选择参数,密度选择参数包括邻域的预定半径和每个轨迹点至少包含的其他移动点的个数为预设个数;
第二确定子单元,用于根据所设定的密度选择参数设定轨迹点的设定条件,根据设定条件确定移动点中的轨迹点,通过轨迹点确定轨迹簇。
其中,轨迹点的设定条件为:每个移动点的邻域内所包含的其他移动点的个数是否大于等于预设个数。例如预设个数为5个。
具体地,在移动点集中随机抽取一个未被分类的移动点为圆心,以预定半径确定移动点的邻域;判断未被分类的移动点的邻域内是否至少包含预定个数的移动点,若是,则确认未被分类的移动点是轨迹点。在本实施方式中,预定半径可以是20m,但不限于此。预定个数为5个。
在本实施方式中,设定条件为:|Nε(xj)|≥minpts,其中,N表示某一个移动点的ε邻域内的移动点个数;ε表示邻域的预定半径;xj表示第j个移动点,j表示自然数;minpts表示每个轨迹点至少包含的移动点的个数;
Nε(xj)={xi∈D|d(xi,xj)≤0},其中,xi表示第i个移动点,i表示自然数,D表示编号后的每个移动点的经纬度信息的数据集,d(xi,xj)表示xi与xj两个移动点之间的距离。
聚类过程中,每次从移动点集中随机抽取未被聚类的移动点进行邻域查找,如果第一次抽取的一个移动点p为核心点,判断核心点的邻域与已知的轨迹簇有无交集,如果没有交集,将移动点p及其邻域内的所有移动点聚为一类并分配新的轨迹簇编码C1,第二次随机抽取移动点q为核心点,发现核心点q的邻域与已知的轨迹簇仍无交集,则移动点q及其邻域内的所有移动点聚为新的一类并分配新的轨迹簇编码C2,继续迭代,直至移动点集中不再存在可将轨迹簇C1集C2合并的未分类的移动点。
可以理解地,若移动点q在另一个移动点p的预定半径内且p为轨迹点,则称移动点q从轨迹点p直接密度可达;若存在移动点o,使得移动点p和移动q都从移动o密度可达,则移动点p和移动点q密度相连;使用密度相连的闭包来发现连通的稠密区域作为簇,基于密度聚类的簇就是一组密度相连的移动点,以实现最大化的密度可达。
可以理解地,轨迹点的影响区域就是其邻域中包含的移动点。
预测单元50包括获取子单元、聚类子单元、第一计算子单元、第二计算子单元及第三确认子单元。
获取子单元,用于获取待预测的某一时间段内的多个MDT测量数据,并根据MDT测量数据确定待预测移动点集;
聚类子单元,用于采用密度聚类算法对待预测移动点集中的移动点进行聚类,形成多个待预测轨迹簇;
第一计算子单元,用于计算每个待预测轨迹簇的轨迹点及其影响区域;
第二计算子单元,用于计算用户轨迹预测模型中各个预设时间段内任意一个轨迹点与待预测轨迹簇的轨迹点之间的欧氏距离;
第三确认子单元,用于选择欧氏距离最小的轨迹簇的用户密度作为待预测轨迹簇的用户密度。
例如:将100个用户的第8天的MDT测量数据作为测试集来验证用户轨迹预测模型的准确性。
预测结果如下:
从预测结果可以看出,除12-14点外,预测准确率达到了80%以上,12-14点休闲时间,用户活动行为具有较大随意性,使得预测结果较低。
在本方案中,通过采集用户的MDT测量数据,从MDT测量数据用户的位置数据,即移动点,通过密度聚类实现轨迹预测,以随着用户MDT测量数据的增长实现动态更新,并且在完全自适应的情形下,提高用户轨迹分析的效率,且具有较高的预测准确度。
本发明实施例提供了一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,其中,计算机指令使计算机执行以下步骤:采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据MDT测量数据确定多个用户在预设时间段内的移动点集;
采用密度聚类算法对预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇;计算每个轨迹簇的轨迹点、其影响区域及每个轨迹点的预测概率,其中,轨迹簇的中心点作为轨迹点;将每个轨迹点按照时间顺序生成轨迹点序列,并利用轨迹点序列得到用户轨迹预测模型;利用用户轨迹预测模型预测目标地理区域内的用户轨迹。
可选地,计算机指令使计算机执行采用密度聚类算法对预设时间段内的移动点集中的移动点进行聚类,形成多个轨迹簇的步骤,包括:设定密度选择参数,密度选择参数包括邻域的预定半径和每个轨迹点至少包含的其他移动点的个数为预设个数;根据所设定的密度选择参数设定轨迹点的设定条件,根据设定条件确定移动点中的轨迹点,通过轨迹点确定轨迹簇。
可选地,计算机指令使计算机执行根据所设定的密度选择参数设定轨迹点的设定条件,根据设定条件确定移动点中的轨迹点,通过轨迹点确定轨迹簇的步骤,包括:
在移动点集中随机抽取一个未被分类的移动点为圆心,以预定半径确定移动点的邻域;判断未被分类的移动点的邻域内是否至少包含预设个数的移动点,若是,则确认未被分类的移动点是轨迹点;根据确定的轨迹点确定轨迹簇。
可选地,计算机指令使计算机执行采集目标地理区域在各个预设时间段内多个用户的MDT测量数据,并根据MDT测量数据确定多个用户在预设时间段内的移动点集的步骤,包括:
根据预设的分割规则及栅格划分精度将目标地理区域划分为多个栅格,其中,每个栅格包括栅格编码;采集目标地理区域在各个预设时间段内的多个用户的MDT测量数据;采用预设的定位算法将各个MDT测量数据进行定位,得到各个移动点的定位信息;根据已划分的多个栅格和所有移动点的定位信息,定位各个移动点所处的栅格;将移动点所处的栅格的栅格编码作为移动点的定位信息;按照用户维度对预设时间段内的移动点进行汇总,得到移动点集。
可选地,计算机指令使计算机还执行以下步骤:在按照用户维度对预设时间段内的移动点进行汇总,得到移动点集之后,按照预设的过滤规则过滤掉移动点集中的无效数据。
图3是本发明实施例提供的一种电子设备300的示意图,如图3所示,该实施例的电子设备300包括:至少一个处理器310及通信接口320;以及与处理器310通信连接的至少一个存储器330,其中,存储器330存储有可被处理器310执行的程序指令,处理器310调用程序指令能够执行上述的配置化数据监控告警方法。为避免重复,此处不一一赘述。
电子设备300可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备可包括,但不仅限于,处理器310、通讯接口320、存储器330。本领域技术人员可以理解,图3仅仅是电子设备300的示例,并不构成对电子设备300的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子设备还可以包括通信总线340等。
所称处理器101可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器330可以是电子设备300的内部存储单元,例如电子设备300的硬盘或内存。存储器330也可以是电子设备300的外部存储设备,例如电子设备300上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,存储器330还可以既包括电子设备300的内部存储单元也包括外部存储设备。存储器330用于存储程序指令以及电子设备所需的其他程序和数据。存储器330还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (10)
1.一种基于密度聚类的用户轨迹预测方法,其特征在于,所述方法包括:
采集划分为多个栅格的目标地理区域在预设时间段内的多个用户的MDT测量数据,并根据所述MDT测量数据确定用户的所有移动点的定位信息以及各个移动点所处的栅格,根据所处的栅格的栅格编码确定所述多个用户在所述预设时间段内的移动点集;
判断所述移动点集中任一个未被分类的移动点在预定半径的邻域内是否至少包含预定个数的移动点,若是,确认未被分类的移动点是轨迹点,并通过轨迹点聚类形成轨迹簇;
将每个所述轨迹点按照时间顺序生成轨迹点序列,并利用所述轨迹点序列得到用户轨迹预测模型;
利用所述用户轨迹预测模型预测所述目标地理区域内的用户轨迹。
2.根据权利要求1所述的方法,其特征在于,在所述判断所述移动点集中任一个未被分类的移动点在预定半径的邻域内是否至少包含预定个数的移动点之前,所述方法包括:
设定密度选择参数,所述密度选择参数包括邻域的预定半径和每个轨迹点至少包含的其他移动点的个数为预设个数。
3.根据权利要求1所述的方法,其特征在于,所述判断所述移动点集中任一个未被分类的移动点在预定半径的邻域内是否至少包含预定个数的移动点的步骤,包括:
在所述移动点集中随机抽取一个未被分类的移动点为圆心,以所述预定半径确定所述移动点的邻域;
判断未被分类的移动点的邻域内是否至少包含所述预设个数的移动点。
4.根据权利要求1所述的方法,其特征在于,所述采集划分为多个栅格的目标地理区域在预设时间段内的多个用户的MDT测量数据,并根据所述MDT测量数据确定用户的所有移动点的定位信息以及各个移动点所处的栅格,根据所处的栅格的栅格编码确定所述多个用户在所述预设时间段内的移动点集的步骤,包括:
根据预设的分割规则及栅格划分精度将所述目标地理区域划分为多个栅格,其中,每个栅格包括栅格编码;
采集所述目标地理区域在各个预设时间段内的多个用户的MDT测量数据;
采用预设的定位算法将各个所述MDT测量数据进行定位,得到各个所述移动点的定位信息;
根据已划分的所述多个栅格和所有所述移动点的定位信息,定位各个所述移动点所处的栅格;
将所述移动点所处的栅格的栅格编码作为所述移动点的定位信息;
按照用户维度对所述预设时间段内的移动点的定位信息进行汇总,得到移动点集。
5.根据权利要求4所述的方法,其特征在于,在所述按照用户维度对所述预设时间段内的移动点进行汇总,得到移动点集之后,所述方法还包括:
按照预设的过滤规则过滤掉所述移动点集中的无效数据。
6.根据权利要求1所述的方法,其特征在于,所述利用所述用户轨迹预测模型预测所述目标地理区域内的用户轨迹的步骤,包括:
获取待预测的某一时间段内的多个MDT测量数据,并根据所述MDT测量数据确定待预测移动点集;
采用密度聚类算法对所述待预测移动点集中的移动点进行聚类,形成多个待预测轨迹簇;
计算每个所述待预测轨迹簇的轨迹点及其邻域中包含的移动点;
计算用户轨迹预测模型中各个预设时间段内任意一个轨迹点与所述待预测轨迹簇的轨迹点之间的欧氏距离;
选择欧氏距离最小的轨迹簇的用户密度作为所述待预测轨迹簇的用户密度。
7.一种基于密度聚类的用户轨迹预测装置,其特征在于,所述装置包括:
采集单元,用于采集划分为多个栅格的目标地理区域在各个预设时间段内的多个用户的MDT测量数据,并根据所述MDT测量数据确定用户的所有移动点的定位信息以及各个移动点所处的栅格,根据所处的栅格的栅格编码确定所述多个用户在所述预设时间段内的移动点集;
聚类单元,用于判断所述移动点集中任一个未被分类的移动点在预定半径的邻域内是否至少包含预定个数的移动点,若是,确认未被分类的移动点是轨迹点,并通过轨迹点聚类形成轨迹簇;
生成单元,用于将每个所述轨迹点按照时间顺序生成轨迹点序列,并利用所述轨迹点序列得到用户轨迹预测模型;
预测单元,用于利用所述用户轨迹预测模型预测所述目标地理区域内的用户轨迹。
8.根据权利要求7所述的装置,其特征在于,所述采集单元,包括:
划分子单元,用于根据预设的分割规则及栅格划分精度将所述目标地理区域划分为多个栅格,其中,每个栅格包括栅格编码;
采集子单元,用于采集所述目标地理区域在各个预设时间段内的多个用户的MDT测量数据;
定位子单元,用于采用预设的定位算法将各个所述MDT测量数据进行定位,得到各个所述移动点的定位信息;根据已划分的所述多个栅格和所有所述移动点的定位信息,定位各个所述移动点所处的栅格;
第一确定子单元,用于将所述移动点所处的栅格的栅格编码作为所述移动点的定位信息;
汇总子单元,用于按照用户维度对所述预设时间段内的移动点的定位信息进行汇总,得到移动点集。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中,所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一所述的基于密度聚类的用户轨迹预测方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令使所述计算机执行权利要求1至6任意一项所述的基于密度聚类的用户轨迹预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910895163.3A CN112543419B (zh) | 2019-09-20 | 2019-09-20 | 一种基于密度聚类的用户轨迹预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910895163.3A CN112543419B (zh) | 2019-09-20 | 2019-09-20 | 一种基于密度聚类的用户轨迹预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112543419A CN112543419A (zh) | 2021-03-23 |
CN112543419B true CN112543419B (zh) | 2022-08-12 |
Family
ID=75012684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910895163.3A Active CN112543419B (zh) | 2019-09-20 | 2019-09-20 | 一种基于密度聚类的用户轨迹预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112543419B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113342905B (zh) * | 2021-06-07 | 2022-10-25 | 北京邮电大学 | 一种停留点确定方法及装置 |
CN113127594B (zh) * | 2021-06-17 | 2021-09-03 | 脉策(上海)智能科技有限公司 | 确定地理区域的组团数据的方法、计算设备和存储介质 |
CN113569978A (zh) * | 2021-08-05 | 2021-10-29 | 北京红山信息科技研究院有限公司 | 一种出行轨迹识别方法、装置、计算机设备及存储介质 |
CN114999669A (zh) * | 2022-05-07 | 2022-09-02 | 淮安市公安局淮安分局 | 一种大数据场景下的疫情防控流调系统及方法 |
CN117349688B (zh) * | 2023-12-01 | 2024-03-19 | 中南大学 | 一种基于峰值轨迹的轨迹聚类方法、装置、设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239556A (zh) * | 2014-09-25 | 2014-12-24 | 西安理工大学 | 基于密度聚类的自适应轨迹预测方法 |
CN107977734A (zh) * | 2017-11-10 | 2018-05-01 | 河南城建学院 | 一种时空大数据下基于移动马尔可夫模型的预测方法 |
CN108882172A (zh) * | 2018-06-22 | 2018-11-23 | 电子科技大学 | 一种基于hmm模型的室内移动轨迹数据的预测方法 |
CN109033011A (zh) * | 2018-06-19 | 2018-12-18 | 东软集团股份有限公司 | 计算轨迹频繁度的方法、装置、存储介质及电子设备 |
WO2019026087A1 (en) * | 2017-07-31 | 2019-02-07 | Kulkarni Hrishikesh | PREDICTION SYSTEM BASED ON INTELLIGENT CONTEXT |
-
2019
- 2019-09-20 CN CN201910895163.3A patent/CN112543419B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104239556A (zh) * | 2014-09-25 | 2014-12-24 | 西安理工大学 | 基于密度聚类的自适应轨迹预测方法 |
WO2019026087A1 (en) * | 2017-07-31 | 2019-02-07 | Kulkarni Hrishikesh | PREDICTION SYSTEM BASED ON INTELLIGENT CONTEXT |
CN107977734A (zh) * | 2017-11-10 | 2018-05-01 | 河南城建学院 | 一种时空大数据下基于移动马尔可夫模型的预测方法 |
CN109033011A (zh) * | 2018-06-19 | 2018-12-18 | 东软集团股份有限公司 | 计算轨迹频繁度的方法、装置、存储介质及电子设备 |
CN108882172A (zh) * | 2018-06-22 | 2018-11-23 | 电子科技大学 | 一种基于hmm模型的室内移动轨迹数据的预测方法 |
Non-Patent Citations (3)
Title |
---|
R3-193105"Report of 3GPP TSG RAN meeting #103Bis";ETSI MCC;《3GPP TSG RAN meeting #104》;20190522;全文 * |
基于机器学习的轨迹预测方法研究;苏璐敏;《中国优秀硕士论文电子期刊网》;20190915;全文 * |
多模式移动对象不确定性轨迹预测模型;乔少杰等;《自动化学报》;20170103(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112543419A (zh) | 2021-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112543419B (zh) | 一种基于密度聚类的用户轨迹预测方法及装置 | |
CN107547633B (zh) | 一种用户常驻点的处理方法、装置和存储介质 | |
CN106547894B (zh) | 基于移动通信信令大数据挖掘职住位置标签的系统及方法 | |
CN102823309B (zh) | 定位方法选择中使用性能历史数据的方法和设备 | |
Laoudias et al. | Crowdsourced indoor localization for diverse devices through radiomap fusion | |
US9179435B2 (en) | Filtering and clustering crowd-sourced data for determining beacon positions | |
CN111867049B (zh) | 定位方法、装置及存储介质 | |
CN108834077B (zh) | 基于用户移动特性的跟踪区划分方法、装置及电子设备 | |
TWI709353B (zh) | 確定移動終端定位間隔的方法、移動終端及伺服器 | |
EP3833122A1 (en) | Method and apparatus for positioning and generating offline fingerprint database | |
EP3132592A1 (en) | Method and system for identifying significant locations through data obtainable from a telecommunication network | |
EP3627884A1 (en) | Method and arrangement for supporting analysis of social networks in a communication network | |
CN105682097A (zh) | 一种伪基站识别定位方法及装置 | |
CN110298687B (zh) | 一种区域吸引力评估方法及设备 | |
CN110719602B (zh) | 指纹定位方法和装置 | |
US20150148068A1 (en) | Method for estimating speed of user devices in wireless communication networks | |
CN109936820B (zh) | 一种用户终端定位方法及装置 | |
CN110493720A (zh) | 终端的定位方法、装置及存储介质 | |
CN105338540A (zh) | 一种基站数据建模的方法及终端 | |
CN108770057B (zh) | 预定指纹库的确定方法及指纹定位方法、装置、存储介质 | |
CN110727752B (zh) | 位置指纹库处理方法、设备及计算机可读存储介质 | |
CN112867147B (zh) | 定位方法和定位装置 | |
CN110348717A (zh) | 基于栅格粒度的基站价值评分方法和装置 | |
CN111428197B (zh) | 数据处理方法、装置及设备 | |
Zheng et al. | RSS-based indoor passive localization using clustering and filtering in a LTE network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |