CN108647735B - 用户出行规律分析方法、装置、设备及存储介质 - Google Patents

用户出行规律分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108647735B
CN108647735B CN201810466939.5A CN201810466939A CN108647735B CN 108647735 B CN108647735 B CN 108647735B CN 201810466939 A CN201810466939 A CN 201810466939A CN 108647735 B CN108647735 B CN 108647735B
Authority
CN
China
Prior art keywords
base station
travel
mobile user
user
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810466939.5A
Other languages
English (en)
Other versions
CN108647735A (zh
Inventor
杜翠凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jiesai Communication Planning And Design Institute Co ltd
GCI Science and Technology Co Ltd
Original Assignee
Guangzhou Jiesai Communication Planning And Design Institute Co ltd
GCI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jiesai Communication Planning And Design Institute Co ltd, GCI Science and Technology Co Ltd filed Critical Guangzhou Jiesai Communication Planning And Design Institute Co ltd
Priority to CN201810466939.5A priority Critical patent/CN108647735B/zh
Publication of CN108647735A publication Critical patent/CN108647735A/zh
Application granted granted Critical
Publication of CN108647735B publication Critical patent/CN108647735B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本发明公开了一种用户出行规律分析的方法,包括:获取待分析的移动用户在一段时间内的移动轨迹数据;根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图;对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径;根据所述目标移动路径,获得所述移动用户的出行频繁模式;根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律。本发明还公开了一种用户出行规律分析的装置、设备及存储介质,能够解决用户的移动路径不准确的问题,提高了分析结果的准确性和可靠性。

Description

用户出行规律分析方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户出行规律分析方法、装置、设备及存储介质。
背景技术
随着移动通信以及大数据技术的应用,越来越多的研究者开始着力于获得移动用户的出行轨迹。近年来,不少研究者通过移动用户的行为信息来分析移动用户的轨迹并得到移动用户的轨迹预测和驻留规律等等。在现有技术中,通常获取移动用户在一段时间内的数据,统计该移动用户在经过每个地点的次数,根据统计到的次数来确定该移动用户的常驻地点,从而得到该移动用户的出行规律。
然而,发明人在实施本发明的过程中发现,现有技术中只考虑移动用户在每个经过的地点上的逗留次数,而实际上,当移动用户处在多个基站信号范围重合的地方,根据信号强度的变化与终端(如手机)通信的基站会发生变化,造成了获取到的用户轨迹数据不准确的问题,降低了分析结果的准确性和可靠性。
发明内容
针对上述问题,本发明的目的在于提供一种用户出行规律分析方法、装置、设备及存储介质,能够解决用户的移动路径不准确的问题,提高了分析结果的准确性和可靠性。
第一方面,本发明实施例提供了一种用户出行规律分析方法,包括:
获取待分析的移动用户在一段时间内的移动轨迹数据;其中,所述移动轨迹数据包括所述移动用户在所述一段时间内经过的至少一条移动轨迹;所述每条移动轨迹包含至少一个基站以及每个所述基站的时间点;
根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图;
对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径;
根据所述目标移动路径,获得所述移动用户的出行频繁模式;
根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律。
在第一方面的第一种实现方式中,所述根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图具体为:
对于每一条移动轨迹:
根据所述时间点,计算预定时间内每两个相邻的基站之间的漂移次数;
根据所述漂移次数以及预设的次数阈值,构造基站连通度拓扑图。
在第一方面的第二种实现方式中,所述对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径具体为:
在所述基站连通度拓扑图中对至少一个基站分配一个唯一的标签;其中,每个已分配的基站的标签是不相同的;
根据所述基站的标签,对所述基站连通度拓扑图中的每个基站进行标签的迭代更新;
当检测到标签更新迭代完成后,将具有相同标签的基站划分为同一个基站类别;
根据每个所述基站类别以及每个所述基站类别中的每个基站的时间点,生成所述移动用户的目标移动路径。
根据第一方面的第二种实现方式,在第一方面的第三种实现方式中,所述根据每个所述基站类别以及每个所述基站类别中的每个基站的时间点,生成所述移动用户的目标移动路径具体为:
将每个所述基站类别的中心位置作为与每个所述基站类别对应的新基站;
根据每个所述基站类别中的每个基站的时间点,将每个所述基站类别替换成对应的所述新基站,生成所述移动用户的目标移动路径;其中所述目标移动路径包括至少一个新基站以及每个所述新基站的时间点。
在第一方面的第四种实现方式中,,所述根据所述目标移动路径,获得所述移动用户的出行频繁模式具体为:
根据所述目标移动路径和预设的最小支持度,构造FP树;
根据所述FP树,获取所述移动用户的出行频繁模式。
根据第一方面的第三种实现方式中,在第一方面的第五种实现方式中,所述根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律具体为:
根据所述出行频繁模式以及所述目标移动路径中的每个所述新基站的时间点,获得与所述出行频繁模式对应的所述新基站的所有目标时间点;
对所述所有目标时间点通过聚类算法进行分析,得到所述移动用户在与所述出行频繁模式对应的所述新基站上的出行规律。
根据第一方面的第五种实现方式,在第一方面的第六种实现方式中,所述聚类算法为DBSCAN算法。
第二方面,本发明实施例还提供了一种用户出行规律分析的装置,包括:
移动轨迹获取模块,用于获取待分析的移动用户在一段时间内的移动轨迹数据;其中,所述移动轨迹数据包括所述移动用户在所述一段时间内经过的至少一条移动轨迹;所述每条移动轨迹包含至少一个基站以及每个所述基站的时间点;
连通图构造模块,用于根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图;
目标路径重构模块,用于对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径;
频繁模式获取模块,用于根据所述目标移动路径,获得所述移动用户的出行频繁模式;
出行规律获取模块,用于根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律。
第三方面,本发明实施例还提供了一种用户出行规律分析的设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述的用户出行规律分析方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的用户出行规律分析方法。
上述技术方案中的一个技术方案具有如下优点:通过构造基站连通度拓扑图进行基站聚类并重构路径,从而对产生漂移现象的基站数据进行预处理,解决了由于基站漂移所带来了移动路径不准确的问题;通过分析用户的出行频繁模式,最终得到所述用户的驻留规律或出行规律,能够提高分析结果的准确性和可靠性。当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的用户出行规律分析方法的流程示意图。
图2是本发明第一实施例提供的用户出行规律分析方法的基站发生漂移的示意图。
图3是本发明第一实施例提供的用户出行规律分析方法的基站连通度拓扑图。
图4是本发明第一实施例提供的用户出行规律分析方法的第二次标签迭代示意图。
图5是本发明第一实施例提供的用户出行规律分析方法的第三次标签迭代示意图。
图6是本发明第一实施例提供的用户出行规律分析方法的第四次标签迭代示意图。
图7是本发明第一实施例提供的用户出行规律分析方法的目标移动路径示意图。
图8是本发明第一实施例提供的用户出行规律分析方法的一种FP树示意图。
图9是本发明第三实施例提供的用户出行规律分析的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明第一实施例提供了一种用户出行规律分析方法,其可以在用户出行规律分析方法的设备上执行,并包括以下步骤:
S10,获取待分析的移动用户在一段时间内的移动轨迹数据;其中,所述移动轨迹数据包括所述移动用户在所述一段时间内经过的至少一条移动轨迹;所述每条移动轨迹包含至少一个基站以及每个所述基站的时间点。
在本实施例中,所述设备可以包括但不限于:桌上型计算机、笔记本、掌上电脑以及手机等各类电子设备,在所述设备上可以获取待分析的移动用户的移动轨迹数据。在本实施例中,所述移动用户的移动轨迹信息可以通过基站定位获取的,作为示例,当移动用户某个基站在发生业务时,移动用户的移动设备(例如手机)会对行为进行广播,当然也可以设置每隔一段时间,移动用户的移动设备就对行为进行广播,在这里,这些行为都记录着所述用户接收信号的基站和其它相关信息等,这就是所述用户的移动轨迹信息,而这些信息会上传并保留在运营商的通话记录中,利用运营商的移动用户的动态的、具有时间时效性的轨迹信息就可以获取得到待分析的移动用户在指定的一段时间内的移动轨迹数据;当然,也可以在待分析的移动用户的移动设备上安装监控软件,所述监控软件可以将所述移动用户的移动轨迹信息发送至所述用户出行规律分析方法的设备上。如表1所示,表1是对某地市5万移动用户的移动轨迹数据进行提取得到的轨迹表:
表1移动用户轨迹表
Figure BDA0001660983370000061
其中,第一列是移动用户的电话号码(MSISDN,可以唯一标识一位移动用户);第二列是开始日期,例如2014年08月03日;第三列、第四列、第五列分别是时、分、秒,例如21时50分34秒;第六列至第九列为结束日期以及时分秒,不再描述。第十列为开始站点(或开始基站),例如开始站点为20656,在这里,用基站代号(cell-id)表示,每一个基站都有一个唯一的代号,根据代号就可以查询到移动用户当时的地理位置。同理,第十一列的结束站点也是一样的。可以理解的是,从轨迹表中可获取得到待分析的移动用户在一段时间内的移动轨迹数据,例如获得该移动用户3个月(例如4月至5月)的移动轨迹数据,并且所述移动轨迹数据中包含所述移动用户在这3个月内经过的所有移动轨迹,并且每条路径还包含每个基站的时间点,作为示例,根据一天(或者一周或者一个月或者工作日或者周末等)经过的基站)可以生成一条移动轨迹,例如某一天的移动轨迹为基站A-基站B-基站C,其中基站A、B和C的时间点分别为8:00:05、8:15:05和9:00:05;在这里,所述时间点为所述移动用户经过或停留在所述基站时的时间点,当然,也可以为离开或者到达所述基站的时间点。
S20,根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图。
在本实施例中,从移动用户发生业务时获取的移动轨迹数据较为连续,当移动用户处在多个基站信号范围重合的地方,会产生基站漂移的现象,即使该移动用户的位置不发生移动,根据信号强度的变化与终端(如手机)通信的基站也会发生变化,这样导致对于同一个地理位置,会记录多个基站代号,从而产生移动用户路径划分错误的现象,因此需要对所述移动轨迹数据进行预处理。
在本实施例的一种实现方式中,具体地,对于每一条移动轨迹:根据所述时间点,计算预定时间内每两个相邻的基站之间的漂移次数;根据所述漂移次数以及预设的次数阈值,构造基站连通度拓扑图。在本实施中,对于每一条移动轨迹,利用连续基站之间的关系构造基站连通度拓扑图。作为示例,假设基站连通度拓扑图为G=<V,E>,其中V表示每一个基站的站址编号(Cell ID),E表示拓扑图的边集合,表示两个基站之间的连通度,也就是基站之间的漂移次数,计算公式如下:
Figure BDA0001660983370000071
其中,所述r表示基站的漂移次数的符号。所述n表示一个用户在某段特定的时间内在某两个基站之间漂移的次数总和(即基站x和基站y之间在特定时间内漂移次数总和),所述shake<x,y>表示基站x和基站y之间发生信号漂移。如果基站之间来回产生切换,那么连通度link<x,y>的值就越大。例如,设置基站A和基站B在10分钟内漂移的次数阈值为5,如果在10分钟内(即预定时间)漂移的次数大于5,那么link<A,B>为1,否则为0。通过上述步骤,可以构造出基站连通度拓扑图G=<V,E>,其中V表示基站,E表示基站连通度拓扑图中的边。作为示例,如图2所示,其中实线表示基站之间发生偏移,虚线表示移动用户的移动轨迹,每个圆圈表示不同的基站,按照预设的漂移的次数阈值,最终得到与该移动轨迹对应的基站连通度拓扑图如图3所示,其中,权重越大表示两个基站之间发生漂移现象的概率越大。
S30,对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径。
在本实施例中,利用区域类型算法或者图聚类算法等可以对所述基站连通度拓扑图中的基站进行聚类,从而对出现信号漂移的基站进行了分类,在这里,可以将一个类中的基站用预设的基站编号来代替,其他没有出现信号漂移现象的基站也可以用相应的基站编号来代替,同样,对于所述基站编号对应的时间点也可以通过上述方法利用原来每个基站的时间点进行重构,从而可以生成新的目标移动路径。
在本实施例的一种实现方式中,具体地,在所述基站连通度拓扑图中对至少一个基站分配一个唯一的标签;其中,每个已分配的基站的标签是不相同的;根据所述基站的标签,对所述基站连通度拓扑图中的每个基站进行标签的迭代更新;当检测到标签更新迭代完成后,将具有相同标签的基站划分为同一个基站类别;根据每个所述基站类别以及每个所述基站类别中的每个基站的时间点,生成所述移动用户的目标移动路径。
在本实施例中,利用标签传播算法(Label Propagation Algorithm,LPA)对基站连通拓扑图中的基站进行聚类。在生成基站连通度拓扑图后,给该基站连通度拓扑图中的某个或者某几个基站分配不同的标签,在这里可以随机选择某些基站进行标识标签,如图3所示,图中标签1和标签2标识两类不同的标签,在这里,标签是随机的,可以根据需求设置标签的种类,即可以根据需求将基站分成多少类,当分配标签之后,进行迭代更新,第一次迭代更新如图3所示,随机选择两个基站并设为标签1和标签2;第二次迭代如图4所示,其中,每个基站的相邻基站被同化了;第三次迭代如图5所示;第四次迭代如图6所示,其中,与两类标签都连接的基站根据哪一类的传播能力强进行迭代,在这里,由于与两类标签都连接的基站的左边的边的权重为8,右边为5,因此该基站迭代后的标签为标签2。当迭代更新完毕后,把该基站连通度拓扑图中的发生漂移的基站分成了两类,对每一个基站类别以一个重编的基站代号进行替换,然后把新编号的基站按照对应的时间点替换漂移的基站类别,从而生成新的目标移动路径。
在本实施例中,具体地,将每个所述基站类别的中心位置作为与每个所述基站类别对应的新基站;根据每个所述基站类别中的每个基站的时间点,将每个所述基站类别替换成对应的所述新基站,生成所述移动用户的目标移动路径;其中所述目标移动路径包括至少一个新基站以及每个所述新基站的时间点。作为示例,如图7所示,将左边4个漂移的基站作为第一新基站进行处理,经纬度取这4个基站的中心(即中心位置),并且所述第一新基站的时间点为这4个基站的时间点利用相同方法进行重构得到;同理,将中间3个漂移的基站作为第二新基站进行处理,经纬度取这3个基站的中心(即中心位置),并且所述第二新基站的时间点为这3个基站的时间点利用相同方法进行重构得到;可以理解的是,由于右边的那一个基站没有与其他基站发生漂移,因此可以将右边的那一个基站作为目标移动路径中的第三新基站;在这里,每个新基站是不相同的(即基站代号是不同的),如图7所示,最终生成所述移动用户的目标移动路径,即图7中的实线部分,其中所述目标移动路径中包含三个新基站以及每个新基站的时间点。
S40,根据所述目标移动路径,获得所述移动用户的出行频繁模式。
在本实施例中,所述频繁模式是指频繁出现在数据集合中的模式(如项集、子序列或者子结构等等),一般采用关联规则的方法来挖掘数据序列的频繁模式。在本实施例中,采用FP-Growth算法来获取所述移动用户的出行频繁模式,FP-Growth算法是通过构建一颗FP树,将频繁模式问题转换成建立一棵后缀树的问题,从而递归的发现短模式,从而降低了搜索的开销。具体地,根据所述目标移动路径和预设的最小支持度,构造FP树;根据所述FP树,获取所述移动用户的出行频繁模式。
在本实施例中,对所述移动用户的移动轨迹数据进行预处理之后,根据重构得到的所有目标移动路径(例如路径1为基站20165-基站23201-基站22301、路径2为基站24301-基站22301-基站23001等等)和预设的最小支持度(例如最小支持度为5,可由用户自行设置或者根据实验得出),构造FP树,具体步骤为:第一步,根据所有目标移动路径建立移动轨迹事务库,扫描该事务库并根据所述最小支持度得到频繁1-项集列表,并根据项集的支持度降序排列,其中,若项集(即基站)的时态支持度小于最小支持度,则该项集不是频繁项集。第二步,以“Root”作为树的根节点,第二次扫描该事务库构建FP树。在构建FP树的过程中,可以根据频繁1-项集项目表建立的项头表,项头表中的每个项目通过节点链指向其在模式树种的第一次出现。模式树种的相同项目均通过这样的节点链依次链接起来。例如,根据所述移动用户的3个月的目标移动路径得到该用户在这3个月的频繁模式树(即FP树)如图8所示,图8中展现了所述移动用户在这3个月内频繁经过的若干路径,即根据所述FP树获取所述移动用户的出行频繁模式,例如出行频繁模式为从基站20165到基站23201或者从基站20165到基站24301等等,可根据实际需要进行选取和分析。
S50,根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律。
在本实施例中,根据所述目标移动路径可以获得与所述出行频繁模式对应的基站的时间点,例如可以研究该移动用户离开某个基站或者到达某个基站的时间规律。作为示例,假设出行频繁模式为从基站20165到基站23201,从该出行频繁模式可以得到该移动用户出现在基站20165之后,会离开基站20165,以一定概率去基站23201,因此把该移动用户在3个月内逗留或离开基站20165的所有时间点进行分析已找到该移动用户离开基站20165去基站23201是否有移动的规律,例如分析得到该移动用户总是在周一至周五的早上8点左右离开基站20165去基站23201,在周末下午3点左右离开基站20165去基站23201的出行规律。
综上所述,通过构造基站连通度拓扑图进行基站聚类并重构路径,从而对产生漂移现象的基站数据进行预处理,解决了由于基站漂移所带来了移动路径不准确的问题,其中利用LPA算法对漂移的基站数据进行预处理,具有高效性,能够提高计算效率;通过分析用户的出行频繁模式,最终得到所述用户的驻留规律或出行规律,能够提高分析结果的准确性和可靠性。
本发明第二实施例:
在第一个实施例的基础上,所述根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律具体为:
根据所述出行频繁模式以及所述目标移动路径中的每个所述新基站的时间点,获得与所述出行频繁模式对应的所述新基站的所有目标时间点;
对所述所有目标时间点通过聚类算法进行分析,得到所述移动用户在于所述出行频繁模式对应的所述新基站上的出行规律。
在本实施例中,所述聚类算法为DBSCAN算法。
在本实施例中,通过对获取得到的与出行频繁模式对应的新基站的时间点利用密度聚类的方法进行分析,可以得到所述移动用户离开或到达某个基站的时间规律或出行规律等。作为示例,假设选取所述移动用户在3个月内的出行频繁模式为从基站20165到基站23201和从基站20165到基站24301,即可以研究该移动用户离开基站20165去往基站23201的时间规律和离开基站20165去往基站24301的时间规律,因此,从这3个月内的所有目标移动路径中提取离开所述基站20165的所有目标时间点,并放进DBSCAN算法中对所述所有目标时间点进行聚类,其中设半径为10分钟且半径内最少的点数为10点,将不满足半径为10分钟且半径内最少的点数为10点的时间点标记为噪音点,最终得到的聚类结果如表2所示:
表2该移动用户离开基站20165的规律
Figure BDA0001660983370000121
其中,所述第一类指的是工作日的时间,所述第二类指的是休息日(即周末)的时间,因此从表2可以得出,该移动用户离开基站20165的规律有2个,第一个规律是该移动用户一般在工作日早上8:00-8:12之间离开基站20165,去往基站23201;第二个规律是该用户一般在休息日早上8:34-8:49之间离开基站20165,去往基站24301,由此可以分析得到所述基站23201很可能就是该移动用户的工作场所。
通过上述方式,基于DBSCAN算法对用户的出行规律进行分析与挖掘,确定半径以及半径包含的点数,利用通信数据的信息快速实现离开某个地点或到达某个地点的时间规律,提高了计算效率。
请参阅图9,本发明第三实施例还提供了一种用户出行规律分析的装置,包括:
移动轨迹获取模块10,用于获取待分析的移动用户在一段时间内的移动轨迹数据;其中,所述移动轨迹数据包括所述移动用户在所述一段时间内经过的至少一条移动轨迹;所述每条移动轨迹包含至少一个基站以及每个所述基站的时间点;
连通图构造模块20,用于根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图;
目标路径重构模块30,用于对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径;
频繁模式获取模块40,用于根据所述目标移动路径,获得所述移动用户的出行频繁模式;
出行规律获取模块50,用于根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律。
优选地,所述连通图构造模块20具体为:
对于每一条移动轨迹:
漂移次数计算单元,用于根据所述时间点,计算预定时间内每两个相邻的基站之间的漂移次数;
连通图生成单元,用于根据所述漂移次数以及预设的次数阈值,构造基站连通度拓扑图。
优选地,所述目标路径重构模块30具体为:
标签分配单元,用于在所述基站连通度拓扑图中对至少一个基站分配一个唯一的标签;其中,每个已分配的基站的标签是不相同的;
标签迭代单元,用于根据所述基站的标签,对所述基站连通度拓扑图中的每个基站进行标签的迭代更新;
类别划分单元,用于当检测到标签更新迭代完成后,将具有相同标签的基站划分为同一个基站类别;
路径生成单元,用于根据每个所述基站类别以及每个所述基站类别中的每个基站的时间点,生成所述移动用户的目标移动路径。
进一步地,所述路径生成单元具体为:
新基站确定单元,用于将每个所述基站类别的中心位置作为与每个所述基站类别对应的新基站;
目标路径生成单元,用于根据每个所述基站类别中的每个基站的时间点,将每个所述基站类别替换成对应的所述新基站,生成所述移动用户的目标移动路径;其中所述目标移动路径包括至少一个新基站以及每个所述新基站的时间点。
优选地,所述频繁模式获取模块40具体为:
FP树构造单元,用于根据所述目标移动路径和预设的最小支持度,构造FP树;
频繁模式获取单元,用于根据所述FP树,获取所述移动用户的出行频繁模式。
进一步地,所述出行规律获取模块50具体为:
目标时间点获取单元,用于根据所述出行频繁模式以及所述目标移动路径中的每个所述新基站的时间点,获得与所述出行频繁模式对应的所述新基站的所有目标时间点;
聚类分析单元,用于对所述所有目标时间点通过聚类算法进行分析,得到所述移动用户在与所述出行频繁模式对应的所述新基站上的出行规律。
进一步地,所述聚类算法为DBSCAN算法。
本发明第四实施例提供了一种用户出行规律分析的设备。该实施例的用户出行规律分析的设备包括:处理器、显示器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如用户出行规律分析的程序。所述处理器执行所述计算机程序时实现上述各个用户出行规律分析的方法的实施例中的步骤,例如图1所示的步骤S10。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各单元的功能,例如图9所示的移动轨迹获取模块10。
示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述用户出行规律分析的设备中的执行过程。
所述用户出行规律分析的设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述用户出行规律分析的设备可包括,但不仅限于,处理器、存储器、显示器。本领域技术人员可以理解,上述部件仅仅是用户出行规律分析的设备的示例,并不构成对用户出行规律分析的设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述用户出行规律分析的设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述用户出行规律分析的设备的控制中心,利用各种接口和线路连接整个所述用户出行规律分析的设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述用户出行规律分析的设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述用户出行规律分析的设备集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (9)

1.一种用户出行规律分析方法,其特征在于,包括:
获取待分析的移动用户在一段时间内的移动轨迹数据;其中,所述移动轨迹数据包括所述移动用户在所述一段时间内经过的至少一条移动轨迹;所述每条移动轨迹包含至少一个基站以及每个所述基站的时间点;
根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图,具体为:对于每条所述移动轨迹,根据每条所述移动轨迹的时间点,计算预定时间内每两个相邻的基站之间的漂移次数;根据所述漂移次数以及预设的次数阈值,构造基站连通度拓扑图;
对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径;
根据所述目标移动路径,获得所述移动用户的出行频繁模式;
根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律。
2.根据权利要求1所述的用户出行规律分析方法,其特征在于,所述对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径具体为:
在所述基站连通度拓扑图中对至少一个基站分配一个唯一的标签;其中,每个已分配的基站的标签是不相同的;
根据所述基站的标签,对所述基站连通度拓扑图中的每个基站进行标签的迭代更新;
当检测到标签更新迭代完成后,将具有相同标签的基站划分为同一个基站类别;
根据每个所述基站类别以及每个所述基站类别中的每个基站的时间点,生成所述移动用户的目标移动路径。
3.根据权利要求2所述的用户出行规律分析方法,其特征在于,所述根据每个所述基站类别以及每个所述基站类别中的每个基站的时间点,生成所述移动用户的目标移动路径具体为:
将每个所述基站类别的中心位置作为与每个所述基站类别对应的新基站;
根据每个所述基站类别中的每个基站的时间点,将每个所述基站类别替换成对应的所述新基站,生成所述移动用户的目标移动路径;其中所述目标移动路径包括至少一个新基站以及每个所述新基站的时间点。
4.根据权利要求1所述的用户出行规律分析方法,其特征在于,所述根据所述目标移动路径,获得所述移动用户的出行频繁模式具体为:
根据所述目标移动路径和预设的最小支持度,构造FP树;
根据所述FP树,获取所述移动用户的出行频繁模式。
5.根据权利要求3所述的用户出行规律分析方法,其特征在于,所述根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律具体为:
根据所述出行频繁模式以及所述目标移动路径中的每个所述新基站的时间点,获得与所述出行频繁模式对应的所述新基站的所有目标时间点;
对所述所有目标时间点通过聚类算法进行分析,得到所述移动用户在与所述出行频繁模式对应的所述新基站上的出行规律。
6.根据权利要求5所述的用户出行规律分析的方法,其特征在于,所述聚类算法为DBSCAN算法。
7.一种用户出行规律分析的装置,其特征在于,包括:
移动轨迹获取模块,用于获取待分析的移动用户在一段时间内的移动轨迹数据;其中,所述移动轨迹数据包括所述移动用户在所述一段时间内经过的至少一条移动轨迹;所述每条移动轨迹包含至少一个基站以及每个所述基站的时间点;
连通图构造模块,用于根据所述移动轨迹数据,构造相应于每条所述移动轨迹的基站连通度拓扑图,其中所述连通图构造模块具体包括:漂移次数计算单元,用于对于每条所述移动轨迹,根据每条所述移动轨迹的时间点,计算预定时间内每两个相邻的基站之间的漂移次数;连通图生成单元,用于根据所述漂移次数以及预设的次数阈值,构造基站连通度拓扑图;
目标路径重构模块,用于对所述基站连通度拓扑图中的基站进行聚类,并根据对应的所述移动轨迹中的所述时间点重构得到所述移动用户的目标移动路径;
频繁模式获取模块,用于根据所述目标移动路径,获得所述移动用户的出行频繁模式;
出行规律获取模块,用于根据所述目标移动路径以及所述出行频繁模式,获得所述移动用户的出行规律。
8.一种用户出行规律分析的设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任意一项所述的用户出行规律分析方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至6中任意一项所述的用户出行规律分析方法。
CN201810466939.5A 2018-05-15 2018-05-15 用户出行规律分析方法、装置、设备及存储介质 Active CN108647735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810466939.5A CN108647735B (zh) 2018-05-15 2018-05-15 用户出行规律分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810466939.5A CN108647735B (zh) 2018-05-15 2018-05-15 用户出行规律分析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108647735A CN108647735A (zh) 2018-10-12
CN108647735B true CN108647735B (zh) 2021-01-12

Family

ID=63756005

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810466939.5A Active CN108647735B (zh) 2018-05-15 2018-05-15 用户出行规律分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108647735B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111107493B (zh) * 2018-10-25 2022-09-02 中国电力科学研究院有限公司 一种移动用户位置预测方法与系统
CN112954603A (zh) * 2019-11-26 2021-06-11 中国移动通信集团甘肃有限公司 一种特殊人群运动轨迹的预测方法及电子设备
WO2021196049A1 (zh) * 2020-03-31 2021-10-07 华为技术有限公司 汽车出行规律的分析方法、服务器及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130026258A (ko) * 2011-09-05 2013-03-13 세림티에스지(주) 도로망 기반의 빈번 차량 궤적 클러스터링 시스템 및 방법
CN104469942A (zh) * 2014-12-24 2015-03-25 福建师范大学 一种基于隐马尔科夫模型的室内定位方法
CN105372687A (zh) * 2015-09-29 2016-03-02 上海斐讯数据通信技术有限公司 一种基于移动设备的运动轨迹绘制方法及系统
CN105404648A (zh) * 2015-10-29 2016-03-16 东北大学 一种基于密度与紧密度聚类的用户移动行为确定方法
CN106101999A (zh) * 2016-05-27 2016-11-09 广州杰赛科技股份有限公司 一种用户轨迹的识别方法及装置
CN106327236A (zh) * 2015-07-10 2017-01-11 华为技术有限公司 一种确定用户行动轨迹的方法及装置
CN107038168A (zh) * 2016-02-03 2017-08-11 中兴通讯股份有限公司 一种用户通勤轨迹管理方法、装置及系统
CN107277765A (zh) * 2017-05-12 2017-10-20 西南交通大学 一种基于聚类离群分析的手机信令轨迹预处理方法
WO2017202226A1 (zh) * 2016-05-23 2017-11-30 中兴通讯股份有限公司 人群流量的确定方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130026258A (ko) * 2011-09-05 2013-03-13 세림티에스지(주) 도로망 기반의 빈번 차량 궤적 클러스터링 시스템 및 방법
CN104469942A (zh) * 2014-12-24 2015-03-25 福建师范大学 一种基于隐马尔科夫模型的室内定位方法
CN106327236A (zh) * 2015-07-10 2017-01-11 华为技术有限公司 一种确定用户行动轨迹的方法及装置
CN105372687A (zh) * 2015-09-29 2016-03-02 上海斐讯数据通信技术有限公司 一种基于移动设备的运动轨迹绘制方法及系统
CN105404648A (zh) * 2015-10-29 2016-03-16 东北大学 一种基于密度与紧密度聚类的用户移动行为确定方法
CN107038168A (zh) * 2016-02-03 2017-08-11 中兴通讯股份有限公司 一种用户通勤轨迹管理方法、装置及系统
WO2017202226A1 (zh) * 2016-05-23 2017-11-30 中兴通讯股份有限公司 人群流量的确定方法及装置
CN106101999A (zh) * 2016-05-27 2016-11-09 广州杰赛科技股份有限公司 一种用户轨迹的识别方法及装置
CN107277765A (zh) * 2017-05-12 2017-10-20 西南交通大学 一种基于聚类离群分析的手机信令轨迹预处理方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Multiple Base Stations Cooperation:A Novel Clustering Algotithm and Its Energy Efficiency;Chao Meng et al;《Wireless Personal Communications》;20151120;351-365 *
Tracking survey for individual travel behavior by using mobile communication instruments;Yasuo Asakura et al;《Transportation Research》;20041231;273-297 *
一种手机定位数据的非运动数据聚类剔除方法;蔡超等;《交通信息与安全》;20100831;第28卷(第4期);60-63 *
基于手机定位数据的用户出行规律分析;张用川;《中国优秀硕士学位论文全文数据库 信心科技辑》;20140215;第2014年卷(第2期);I136-447 *
基于空间密度聚类的移动用户热点区域识别方法;杜翠凤等;《移动通信》;20151231(第16期);40-43 *
针对基站聚类和用户行为分析的移动通信网络资源优化技术研究;杨栋;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150415;第2015年卷(第4期);I136-824 *

Also Published As

Publication number Publication date
CN108647735A (zh) 2018-10-12

Similar Documents

Publication Publication Date Title
CN108289121B (zh) 营销信息的推送方法及装置
CN111210269B (zh) 基于大数据的对象识别方法、电子装置及存储介质
CN108647735B (zh) 用户出行规律分析方法、装置、设备及存储介质
US10909554B2 (en) Analyzing big data to determine a data plan
CN108566618A (zh) 获取用户驻留规律的方法、装置、设备及存储介质
CN110515968B (zh) 用于输出信息的方法和装置
CN104657372A (zh) 页面操作数据处理方法及装置
CN106055630A (zh) 日志存储的方法及装置
US9635507B2 (en) Mobile device analytics
US11410062B2 (en) Method and system for reducing risk values discrepancies between categories
CN108629054A (zh) 社群推送方法、装置、计算机装置及计算机可读存储介质
CN110910054A (zh) 轨迹的确定方法和装置、时间的推荐方法和装置
CN110619090B (zh) 一种区域吸引力评估方法及设备
CN112887910B (zh) 异常覆盖区域的确定方法、装置和计算机可读存储介质
CN112650946A (zh) 产品信息的推荐方法、装置、系统及存储介质
CN111797181B (zh) 用户职住地的定位方法、装置、控制设备及存储介质
CN111563134B (zh) 定位系统的指纹数据库聚类方法、系统、设备和存储介质
CN114741594A (zh) 一种信息推送方法、装置、计算机设备及存储介质
CN107295105A (zh) 儿童行为的分析方法及终端设备、计算机可读存储介质
CN104376021A (zh) 文件推荐系统及方法
CN114429644A (zh) 图像底库的更新方法、装置、设备及存储介质
CN110557726B (zh) 信息推送方法及相关产品
CN107426699A (zh) 儿童行为的分析方法及终端设备、计算机可读存储介质
CN113312104A (zh) 一种基于小程序的广告转化方法和系统
CN108268545A (zh) 一种分级的用户标签库的创建的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant