CN108566618B - 获取用户驻留规律的方法、装置、设备及存储介质 - Google Patents

获取用户驻留规律的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108566618B
CN108566618B CN201810305210.XA CN201810305210A CN108566618B CN 108566618 B CN108566618 B CN 108566618B CN 201810305210 A CN201810305210 A CN 201810305210A CN 108566618 B CN108566618 B CN 108566618B
Authority
CN
China
Prior art keywords
user
place
residence
stay
law
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810305210.XA
Other languages
English (en)
Other versions
CN108566618A (zh
Inventor
杜翠凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Jiesai Communication Planning And Design Institute Co ltd
GCI Science and Technology Co Ltd
Original Assignee
Guangzhou Jiesai Communication Planning And Design Institute Co ltd
GCI Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Jiesai Communication Planning And Design Institute Co ltd, GCI Science and Technology Co Ltd filed Critical Guangzhou Jiesai Communication Planning And Design Institute Co ltd
Priority to CN201810305210.XA priority Critical patent/CN108566618B/zh
Publication of CN108566618A publication Critical patent/CN108566618A/zh
Application granted granted Critical
Publication of CN108566618B publication Critical patent/CN108566618B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72451User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to schedules, e.g. using calendar applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72457User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to geographic location
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Environmental & Geological Engineering (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种获取用户驻留规律的方法,包括:获取待挖掘的用户在一段时间内的移动轨迹信息;根据每个所述地点的逗留次数和逗留时长,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息;根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则;根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律。本发明还公开了一种获取用户驻留规律的装置、设备及存储介质,能够解决仅采用逗留次数进行常驻地点识别产生误差和缺陷的问题,可以降低计算的复杂度并且提高计算的精确度。

Description

获取用户驻留规律的方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种获取用户驻留规律的方法、装置、设备及存储介质。
背景技术
随着移动通信以及大数据技术的应用,越来越多的研究者开始着力于挖掘移动用户的出行时空轨迹。近年来,不少研究者通过移动用户的行为信息来找出移动用户的出行规律。在现有技术中,通常获取移动用户在一段时间内的数据,统计该移动用户在经过每个地点的次数,根据统计到的次数来确定该移动用户的常驻地点,从而得到该移动用户的出行规律。
然而,发明人在实施本发明的过程中发现,现有技术中只考虑移动用户在每个经过的地点上的逗留次数,并没有结合移动用户在每个地点上的驻留时长进行分析确定移动用户的常驻地点,也没有根据用户在每个地点的时间时效性等来分析移动用户的出行规律,不能体现用户在不同时间规律上的出行规律,降低了分析结果的准确性和可靠性。
发明内容
针对上述问题,本发明的目的在于提供一种获取用户驻留规律的方法、装置、设备及存储介质,能够解决仅采用逗留次数进行常驻地点识别产生误差和缺陷的问题,可以降低计算的复杂度并且提高计算的精确度。
第一方面,本发明实施例提供了一种获取用户驻留规律的方法,包括:
获取待挖掘的用户在一段时间内的移动轨迹信息;所述移动轨迹信息包括所述用户在所述一段时间内经过的至少一个地点、以及在每个所述地点的逗留次数、逗留时间点和逗留时长;
根据每个所述地点的逗留次数和逗留时长,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息;
根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则;
根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律。
在第一方面的第一种实现方式中,所述根据每个所述地点的逗留次数和逗留时长,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息,具体为:
根据每个所述地点的逗留次数和逗留时长,计算所述用户在每个所述地点的加权值;
根据计算得到的每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。
根据第一方面的第一种实现方式,在第一方面的第二种实现方式中,所述根据每个所述地点的逗留次数和逗留时长,计算所述用户在每个所述地点的加权值,具体为:
根据所述用户在每个所述地点的逗留次数,计算所述用户在每个所述地点的逗留频率;
计算所述用户在每个所述地点的逗留频率和逗留时长的加权值。
根据第一方面的第二种实现方式,在第一方面的第三种实现方式中,所述根据计算得到的每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息,具体为:
根据所述用户的每个所述地点的加权值设定阈值;
根据所述阈值和每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。
在第一方面的第四种实现方式中,所述根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则,具体为:
根据预定的时间分区规则、所述目标轨迹信息以及预设的时态支持度,获得所述用户的所有常驻地点并构造FP树;
根据所述FP树,获得与所述FP树对应的所有关联规则。
在第一方面的第五种实现方式中,所述根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律,具体为:
对于每一个关联规则:
根据所述关键规则以及所述常驻地点的逗留时间点,获得与所述关联规则对应的所述常驻地点的指定状态的所有时间点;
对所述所有时间点通过聚类算法进行分析,得到所述用户在与所述关联规则对应的所述常驻地点上的驻留规律。
根据第一方面的第五种实现方式,在第一方面的第六种实现方式中,所述聚类算法为DBSCAN算法。
第二方面,本发明实施例还提供了一种获取用户驻留规律的装置,包括:
移动轨迹获取模块,用于获取待挖掘的用户在一段时间内的移动轨迹信息;所述移动轨迹信息包括所述用户在所述一段时间内经过的至少一个地点、以及在每个所述地点的逗留次数、逗留时间点和逗留时长;
轨迹预处理模块,用于根据每个所述地点的逗留次数和逗留时长,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息;
常驻地点获取模块,用于根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则;
驻留规律获取模块,用于根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律。
第三方面,本发明实施例还提供了一种获取用户驻留规律的设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述的获取用户驻留规律的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的获取用户驻留规律的方法。
上述技术方案中的一个技术方案具有如下优点:对用户的移动轨迹进行预处理,删除所述用户的非常驻地点,可以降低计算复杂度并且提高计算的精确度,能够在很大程度上剔除噪音数据,能够避免仅仅采用逗留次数进行常驻地点识别的缺陷;根据预设的时间分区规则挖掘所述用户的常驻地点,考虑时间时效性,提高常驻地点识别的准确性,从而最终得到所述用户的驻留规律或出行规律。当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明第一实施例提供的获取用户驻留规律的方法的流程示意图。
图2是本发明第一实施例提供的获取用户驻留规律的方法的总的FP树。
图3是本发明第一实施例提供的获取用户驻留规律的方法的分区P1的FP树示意图。
图4是本发明第一实施例提供的获取用户驻留规律的方法的分区P2的FP树示意图。
图5是本发明第一实施例提供的获取用户驻留规律的方法的分区P3的FP树示意图。
图6是本发明第二实施例提供的获取用户驻留规律的方法的一种聚类结果示意图。
图7是本发明第三实施例提供的获取用户驻留规律的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明第一实施例提供了获取用户驻留规律的方法,其可以在获取用户驻留规律的设备上执行,并包括以下步骤:
S10,获取待挖掘的用户在一段时间内的移动轨迹信息;所述移动轨迹信息包括所述用户在所述一段时间内经过的至少一个地点、以及在每个所述地点的逗留次数、逗留时间点和逗留时长。
在本实施例中,所述设备可以包括但不限于:桌上型计算机、笔记本、掌上电脑以及手机等各类电子设备,在所述设备上可以获取待挖掘的用户的移动轨迹信息。在本实施例中,所述用户的移动轨迹可以通过基站(即用户经过或逗留的地点、区域等)定位获取的,作为示例,当用户某个地点(基站)在发生业务时,用户的移动设备(例如手机)会对行为进行广播,当然也可以设置每隔一段时间,用户的移动设备就对行为进行广播,在这里,这些行为都记录着所述用户接收信号的地点(基站)和其它相关信息等,这就是所述用户的轨迹信息,而这些信息会上传并保留在运营商的通话记录中,利用运营商的移动用户的动态的、具有时间时效性的轨迹信息就可以获取得到待挖掘的用户在一段时间内的移动轨迹。在这里,所述移动轨迹包括所述用户在所述一段时间内经过的所有地点,并且还包括所述用户在每个经过的地点的逗留次数、逗留时间点以及逗留时长,在这里,所述每个地点的逗留时间点为所述用户逗留在该地点的每次时间点的集合,所述每个地点的逗留时长可以为所述用户在该地点的每次逗留的时长的总和。可以理解的是,根据所述移动轨迹信息,可以清楚地知道所述用户在所述一段时间内的某一天、某几天或者某几周等所经过或逗留的地点。
S20,根据每个所述地点的逗留次数和逗留时长,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。
在本实施例中,需要对所述用户的移动轨迹信息进行预处理,删除所述用户的非常驻地点,例如删除逗留次数特别少并且逗留时长特别短的地点,以降低计算的复杂度。在本实施例中,可以采用TF-IDF的方法来实现对所述用户的移动轨迹信息的预处理。具体地:
第一步,根据每个所述地点的逗留次数和逗留时长,计算所述用户在每个所述地点的加权值。
在本实施例中,需要计算所述用户经过的每个地点的权重(即加权值),具体地,根据所述用户在每个所述地点的逗留次数,计算所述用户在每个所述地点的逗留频率;计算所述用户在每个所述地点的逗留频率和逗留时长的加权值。在本实施例中,根据所述用户的每个所述地点的逗留次数,可以计算得到所述用户在所述移动轨迹信息中的所有地点的总逗留次数,进而可以计算得出所述用户的每个所述地点的逗留频率。作为示例,假设所述用户在一个月内经过的所有地点内一共逗留了300次,其中所述用户在该月内经过了150次A地点,那么所述用户在A地点的逗留频率为150/300=0.5。
在本实施例中,根据所述用户在每个所述地点的逗留时长以及逗留频率可以计算得到所述用户在每个所述地点的加权值。作为示例,计算用户u在地点v的逗留时长与逗留频率的加权值TF-IDFuv。其中:
TF-IDFuv=tfuv×idfuv×(Tuv/T);
在这里,所述tfuv为所述用户u在地点v的逗留频率,所述idfuv为所述用户u在所有地点逗留的逆频次,Tuv为所述用户u在所述地点v的逗留时长,T为所述用户u在所有地点的总逗留时长。需要说明的是,所述idfuv是对所述地点v的普遍重要性的度量,也就是等于所述用户u所在的一定区域范围内(例如所述用户u所在的城市)的总用户数除以曾经逗留过所述地点v的用户数。如果去过所述地点v的用户越少,那么所述idfuv的值就越高。因此,如果所述用户u在所述地点v的逗留次数越多,则整个所述地区范围内(例如城市)曾经逗留在所述地点v的用户就越少,那么所述用户u的TF-IDFuv值就越高。可以知道的是,通过上述方式,可以获得所述用户在每个地点的TF-IDF值。
第二步,根据计算得到的每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。
在本实施例中,可以按照所述用户的每个所述地点的加权值的大小,判断哪些地点为所述用户的非常驻地点,并从所述用户的移动轨迹信息中将该非常驻地点删除,同时也可以将该非常驻地点的逗留次数、逗留时长以及逗留时间点删除,最终生成所述用户的目标轨迹信息,其中,所述目标轨迹信息包括在所述移动轨迹信息中剔除非常驻地点之后剩下的其他地点,以及其他地点的逗留次数、逗留时长以及逗留时间点等。当然,也可以通过设定一个阈值,将加权值小于所述阈值的地点从所述用户的移动轨迹信息中将该非常驻地点删除。具体地,根据所述用户的每个所述地点的加权值设定阈值;根据所述阈值和每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。作为示例,根据所述用户u的每个所述地点的加权值来设定阈值I(C),其中:
Figure BDA0001619809120000081
在这里,所述d(u)表示所述用户u到达过的所述地点的个数,即所述移动轨迹信息中所有的不同的地点的数量;C表示所述用户u到达过的所有点,即所述移动轨迹信息中所有的不同的地点。
在本实施例中,作为示例,将所述用户u的每个所述地点的加权值(TF-IDF值)与所述阈值I(C)进行比较,例如,假设所述用户u地点v的TF-IDFuv值小于所述阈值I(C),则认定所述地点v为所述用户u的非常驻区域,因此从所述用户的所有所述地点中剔除所述地点v,因此将所有非常驻地点都删除之后,最后可以得到所述用户u的目标轨迹信息。
S30,根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则。
在本实施例中,将所述一段时间内按照预定规则进行分区,一般来说,一周的工作日和周末按照天数来说是不同权重的,因此需要根据实际情况灵活划分分区,使得每个分区的权重都是同等重要性的,例如将一周的时间划分为2个分区,分别是工作日和周末。接着将所述目标轨迹信息中的所有地点按照分区规则并且采用FP树的方法计算出所述用户的所有常驻地点和关联规则。
在本实施例中,具体地,根据预定的时间分区规则、所述目标轨迹信息以及预设的时态支持度,获得所述用户的所有常驻地点并构造FP树;根据所述FP树,获得与所述FP树对应的所有关联规则。作为示例,所述一段时间为1月至3月,在划分分区时,根据实际需要对时间进行划分,在这里,以月为单位分为3个区间(P1、P2和P3),把一个月的时间划分为8个事务(或8个分区),分别是工作日、周末、工作日、周末、工作日、周末、工作日以及周末等8个事务,能够充分体现出现实生活中工作日出行和非工作日出行的规律。其中,待挖掘的事务数据(即所述用户在每个事务中所经过或逗留的地点),如表1所示:
表1待挖掘的事务数据表
Figure BDA0001619809120000091
其中A、B、C、D、E为所述目标轨迹信息中包含的地点。假设时态支持度为0.5,时态置信度为0.75,具体计算过程如下:根据表1(待挖掘的事务数据表)可以得到所有1-项集的信息,如表2所示:
表2 1-项集的信息表
1-项集 有效时间 出现次数 有效时间内的事务总数 时态支持度
A [1,3] 12 24 0.5
B [1,3] 13 24 0.6
C [1,3] 18 24 0.75
D [1,3] 9 24 0.4
E [1,3] 12 24 0.5
从表2中可以得到项集D的时态支持度小于时态支持度0.5,因此可得到频繁1-项集L1={A,B,C,E},即可以得到所述用户的常驻地点为A、B、C和E,其中地点E为特殊时间的常驻地点,即可以得出所述用户基本会在周末的时候去地点E。接着,构造总的FP树,如图2所示,再分别构造分区P1、P2和P3的FP树,如图3、图4和图5所示,因此可以得到{AB}、{AC}、{BC}和{CE}等频繁项集,根据所述频繁项集计算关联规则,例如,{AB}的有效时间为[1,3],|A|=12,|B|=13,|AB|=10,|AB|/|A|=10/12>|AB|/|B|=10/13>0.75(时态置信度),因此关联规则为B->A,同理,可以得到其他关联规则,例如C->A等等。
S40,根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律。
在本实施例中,所述常驻地点的逗留时间点可以从所述移动轨迹信息或所述目标轨迹信息中获取,从而分析所述用户的驻留规律,例如得到的常驻地点E,可以知道所述用户在周末的时候基本都会去地点E,对所述地点E的逗留时间点进行分析,即对所述用户每次去地点E的时间点进行分析,可以得到所述用户在所述地点E的驻留规律或出行规律,例如得到所述用户一般在什么时候去地点E等。在本实施例中,根据FP树得到的关联规则以及与所述关联规则对应的常驻地点的时间点来分析得到所述用户的出行规律或驻留规律,例如,假设所述地点A为所述用户的家,所述地点B为所述用户的工作地点,对于关联规则B->A,可以从这个关联规则中得出所述用户出现在家这个地点,然后会离开家,以一定的百分比的概率去工作的地方,因此把所述用户在所述一段时间内离开家的所有时间点进行分析,以找到所述用户离开家里去工作的时间是否有一定的规律,比如,分析发现所述用户总是在周一、周三和周五早上8点左右离开家去工作的地方,在周二、周四、周六下午3点左右离开家,这样就得到了所述用户离开家去工作的地方的时间规律。
综上所述,采用TF-IDF的方法实现用户移动轨迹信息的预处理,能够在很大程度上提出噪音数据,除此之外,结合逗留时长和逗留次数来初步筛选用户可能常驻的地点,能够避免仅仅采用逗留次数进行常驻区域识别的缺陷,降低了计算的复杂度并且提高了计算的精确度。并且采用分区的时态关联规则的算法,充分考虑了时间的时效性,不仅能够找到特殊时间的常驻地点(例如地点E),而且只需要对数据库扫描2次,大大提高了计算效率。
本发明第二实施例:
在第一个实施例的基础上,所述根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律,具体为:
对于每一个关联规则:
根据所述关键规则以及所述常驻地点的逗留时间点,获得与所述关联规则对应的所述常驻地点的指定状态的所有时间点;
对所述所有时间点通过聚类算法进行分析,得到所述用户在与所述关联规则对应的所述常驻地点上的驻留规律。
在本实施例中,所述聚类算法为DBSCAN算法。
在本实施例中,根据所述关联规则以及所述常驻地点的逗留时间点,找到所有离开与所述关联规则对应的常驻地点的离开时间点或者到达所述常驻地点的到达时间点,即找到所述常驻地点的指定状态的所有时间点,其中所述离开时间点或所述到达时间点有发生位置变化后的那个时间点来确定,例如,对于关联规则B->A,若8:08时用户在地点A,而8:20时用户在地点B,因此可以得到离开地点A的时间点为8:20。同理,获得常驻地点的到达时间点的规则也一样。接着,对所有离开时间点或者到达时间点进行密度聚类分析,可以得到所述用户离开或到达某个常驻地点的时间规律等。
作为示例,根据关联规则B->A,可以得到所述用户每天离开地点A的时间点,接着,采用DBSCAN的算法对所述用户每天离开地点A的所有时间点进行聚类,其中设半径为10分钟且半径内最少的点数为10点,将不满足半径为10分钟且半径内最少的点数为10点的时间点标记为噪音点,最后得到的聚类结果如图6所示,从图6中可以得到所述用户每天离开地点A的时间点的聚类结果如表3所示:
表3用户每天离开地点A的时间点聚类结果表
Figure BDA0001619809120000121
因此从表3中可以分析得到,所述用户会在两类时间段离开地点A,第一类为8:00-8:12的区间内;第二类在8:00-8:12的区间内,即结果说明所述用户频繁在[8:00,8:12]和[8:00,8:12]这两个时间区间内离开A点。同理,可以计算所述用户在其他常驻地点的驻留规律,比如所述用户到达或离开其他常驻地点的时间规律等,在此不再赘述。
通过上述方式,基于DBSCAN算法对用户的出行规律进行分析与挖掘,在确定常驻地点和关联规则的基础上,利用通信数据的信息(即用户的移动轨迹信息),确定半径以及半径包含的点数,快速实现离开某个地点或到达某个地点的时间规律,提高了计算效率。
请参阅图7,本发明第三实施例提供了一种获取用户驻留规律的装置,包括:
移动轨迹获取模块10,用于获取待挖掘的用户在一段时间内的移动轨迹信息;所述移动轨迹信息包括所述用户在所述一段时间内经过的至少一个地点、以及在每个所述地点的逗留次数、逗留时间点和逗留时长;
轨迹预处理模块20,用于根据每个所述地点的逗留次数和逗留时长,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息;
常驻地点获取模块30,用于根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则;
驻留规律获取模块40,用于根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律。
优选地,所述轨迹预处理模块20,具体为:
第一计算单元,用于根据每个所述地点的逗留次数和逗留时长,计算所述用户在每个所述地点的加权值;
第一删除单元,用于根据计算得到的每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。
进一步地,所述第一计算单元,具体为:
频率计算单元,用于根据所述用户在每个所述地点的逗留次数,计算所述用户在每个所述地点的逗留频率;
第二计算单元,用于计算所述用户在每个所述地点的逗留频率和逗留时长的加权值。
进一步地,所述第一删除单元,具体为:
阈值设定单元,用于根据所述用户的每个所述地点的加权值设定阈值;
第二删除单元,用于根据所述阈值和每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。
优选地,所述常驻地点获取模块30,具体为:
常驻地点获取单元,用于根据预定的时间分区规则、所述目标轨迹信息以及预设的时态支持度,获得所述用户的所有常驻地点并构造FP树;
关联规则获取单元,用于根据所述FP树,获得与所述FP树对应的所有关联规则。
优选地,所述驻留规律获取单元40,具体为:
对于每一个关联规则:
时间点获取单元,用于根据所述关键规则以及所述常驻地点的逗留时间点,获得与所述关联规则对应的所述常驻地点的指定状态的所有时间点;
驻留规律获取单元,用于对所述所有时间点通过聚类算法进行分析,得到所述用户在与所述关联规则对应的所述常驻地点上的驻留规律。
进一步地,所述聚类算法为DBSCAN算法。
本发明第四实施例提供了一种获取用户驻留规律的设备。该实施例的获取用户驻留规律的设备包括:处理器、显示器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如获取用户驻留规律的程序。所述处理器执行所述计算机程序时实现上述各个获取用户驻留规律的方法的实施例中的步骤,例如图1所示的步骤S10。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各单元的功能,例如图7所示的移动轨迹获取模块10。
示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述获取用户驻留规律的设备中的执行过程。
所述获取用户驻留规律的设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述获取用户驻留规律的设备可包括,但不仅限于,处理器、存储器、显示器。本领域技术人员可以理解,上述部件仅仅是获取用户驻留规律的设备的示例,并不构成对获取用户驻留规律的设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述获取用户驻留规律的设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述获取用户驻留规律的设备的控制中心,利用各种接口和线路连接整个所述获取用户驻留规律的设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述获取用户驻留规律的设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述获取用户驻留规律的设备集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (8)

1.一种获取用户驻留规律的方法,其特征在于,包括:
获取待挖掘的用户在一段时间内的移动轨迹信息;所述移动轨迹信息包括所述用户在所述一段时间内经过的至少一个地点、以及在每个所述地点的逗留次数、逗留时间点和逗留时长;
根据所述用户在每个所述地点的逗留次数,计算所述用户在每个所述地点的逗留频率;计算所述用户在每个所述地点的逗留频率和逗留时长的加权值;根据计算得到的每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息;
根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则;
根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律。
2.根据权利要求1所述的获取用户驻留规律的方法,其特征在于,所述根据计算得到的每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息,具体为:
根据所述用户的每个所述地点的加权值设定阈值;
根据所述阈值和每个所述地点的加权值,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息。
3.根据权利要求1所述的获取用户驻留规律的方法,其特征在于,所述根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则,具体为:
根据预定的时间分区规则、所述目标轨迹信息以及预设的时态支持度,获得所述用户的所有常驻地点并构造FP树;
根据所述FP树,获得与所述FP树对应的所有关联规则。
4.根据权利要求1所述的获取用户驻留规律的方法,其特征在于,所述根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律,具体为:
对于每一个关联规则:
根据所述关联规则以及所述常驻地点的逗留时间点,获得与所述关联规则对应的所述常驻地点的指定状态的所有时间点;
对所述所有时间点通过聚类算法进行分析,得到所述用户在与所述关联规则对应的所述常驻地点上的驻留规律。
5.根据权利要求4所述的获取用户驻留规律的方法,其特征在于,所述聚类算法为DBSCAN算法。
6.一种获取用户驻留规律的装置,其特征在于,包括:
移动轨迹获取模块,用于获取待挖掘的用户在一段时间内的移动轨迹信息;所述移动轨迹信息包括所述用户在所述一段时间内经过的至少一个地点、以及在每个所述地点的逗留次数、逗留时间点和逗留时长;
轨迹预处理模块,用于根据每个所述地点的逗留次数和逗留时长,从所述移动轨迹中删除所述用户的非常驻地点并生成所述用户的目标轨迹信息;
常驻地点获取模块,用于根据预定的时间分区规则和所述目标轨迹信息,采用FP树挖掘所述用户的所有常驻地点和所有关联规则;
驻留规律获取模块,用于根据所述关联规则以及所述常驻地点的逗留时间点,得到所述用户的驻留规律。
7.一种获取用户驻留规律的设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的获取用户驻留规律的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任意一项所述的获取用户驻留规律的方法。
CN201810305210.XA 2018-04-04 2018-04-04 获取用户驻留规律的方法、装置、设备及存储介质 Active CN108566618B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810305210.XA CN108566618B (zh) 2018-04-04 2018-04-04 获取用户驻留规律的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810305210.XA CN108566618B (zh) 2018-04-04 2018-04-04 获取用户驻留规律的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN108566618A CN108566618A (zh) 2018-09-21
CN108566618B true CN108566618B (zh) 2020-07-28

Family

ID=63534133

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810305210.XA Active CN108566618B (zh) 2018-04-04 2018-04-04 获取用户驻留规律的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108566618B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111212383B (zh) * 2018-11-01 2021-09-10 百度在线网络技术(北京)有限公司 区域常住人口数量的确定方法、装置、服务器和介质
CN111222056B (zh) * 2018-11-26 2023-07-25 中国移动通信集团重庆有限公司 相关用户的匹配方法、装置、设备和介质
CN111222381A (zh) * 2018-11-27 2020-06-02 中国移动通信集团上海有限公司 用户出行方式识别方法、装置、电子设备及存储介质
CN111667127B (zh) * 2019-03-05 2023-04-18 杭州海康威视系统技术有限公司 一种智能监管方法、装置及电子设备
CN111179136A (zh) * 2019-08-01 2020-05-19 北京百分点信息科技有限公司 一种动态管控方法、装置、电子设备
CN110598131B (zh) * 2019-08-20 2020-12-04 北京三快在线科技有限公司 确定用户常驻区域的方法、装置、存储介质和电子设备
CN111223013B (zh) * 2019-12-25 2023-01-10 重庆特斯联智慧科技股份有限公司 一种基于位置标记的旅游路线智慧生成方法与系统
CN111083636B (zh) * 2019-12-27 2021-11-30 中国联合网络通信集团有限公司 运动状态信息的处理方法及设备
JP6810978B1 (ja) * 2020-03-16 2021-01-13 株式会社ピース企画 クラスタ生成装置、クラスタ生成方法及びクラスタ生成プログラム
CN111563671A (zh) * 2020-04-28 2020-08-21 重庆中科云从科技有限公司 一种区域人员管理方法、系统、机器可读介质及设备
CN113935881A (zh) * 2021-12-16 2022-01-14 北京融信数联科技有限公司 一种基于大数据的人口结构分析方法、系统及可读存储介质
CN114219379B (zh) * 2022-02-22 2022-05-24 北京融信数联科技有限公司 一种适用于社区服务圈的资源配套评估方法、及系统
CN117648500B (zh) * 2023-12-15 2024-08-30 山东融信数科信息科技有限公司 一种基于云数据处理的人群地址匹配方法、系统和介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102264049A (zh) * 2010-05-26 2011-11-30 中兴通讯股份有限公司 小区短信系统及处理方法
CN104035396A (zh) * 2014-04-18 2014-09-10 重庆大学 基于无线传感器网络的分布式行为识别方法
CN104753728A (zh) * 2013-12-27 2015-07-01 中国移动通信集团山东有限公司 一种用户流量监测方法及系统
WO2015188324A1 (zh) * 2014-06-11 2015-12-17 华为技术有限公司 移动终端位置预测方法及装置
CN106778876A (zh) * 2016-12-21 2017-05-31 广州杰赛科技股份有限公司 基于移动用户轨迹相似性的用户分类方法和系统
CN107038620A (zh) * 2017-02-15 2017-08-11 阿里巴巴集团控股有限公司 基于用户打车偏好的信息推送及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102264049A (zh) * 2010-05-26 2011-11-30 中兴通讯股份有限公司 小区短信系统及处理方法
CN104753728A (zh) * 2013-12-27 2015-07-01 中国移动通信集团山东有限公司 一种用户流量监测方法及系统
CN104035396A (zh) * 2014-04-18 2014-09-10 重庆大学 基于无线传感器网络的分布式行为识别方法
WO2015188324A1 (zh) * 2014-06-11 2015-12-17 华为技术有限公司 移动终端位置预测方法及装置
CN106778876A (zh) * 2016-12-21 2017-05-31 广州杰赛科技股份有限公司 基于移动用户轨迹相似性的用户分类方法和系统
CN107038620A (zh) * 2017-02-15 2017-08-11 阿里巴巴集团控股有限公司 基于用户打车偏好的信息推送及装置

Also Published As

Publication number Publication date
CN108566618A (zh) 2018-09-21

Similar Documents

Publication Publication Date Title
CN108566618B (zh) 获取用户驻留规律的方法、装置、设备及存储介质
US11593671B2 (en) Systems and methods for semantic analysis based on knowledge graph
CN107040397B (zh) 一种业务参数获取方法及装置
CN109034861B (zh) 基于移动端日志行为数据的用户流失预测方法及装置
EP3471374B1 (en) Method and device for identifying type of geographic location at where user is located
US20160379268A1 (en) User behavior data analysis method and device
US11475055B2 (en) Artificial intelligence based method and apparatus for determining regional information
CN110909009B (zh) 基于话单的轨迹伴随行为分析方法、终端设备及存储介质
CN110162518B (zh) 数据分组方法、装置、电子设备及存储介质
CN111882398A (zh) 智慧城市服务推荐方法、装置、计算机设备及存储介质
CN112116454B (zh) 信用评估方法及装置
CN111666298A (zh) 基于flink的用户服务类别检测方法、装置、计算机设备
CN113313464A (zh) 结合人工智能的云办公大数据处理方法及云办公服务器
CN112115372A (zh) 一种停车场的推荐方法及装置
CN111797181B (zh) 用户职住地的定位方法、装置、控制设备及存储介质
CN113190795A (zh) 统计实际管理人口数据的方法、装置、介质及设备
CN108711073B (zh) 用户分析方法、装置及终端
CN115795345A (zh) 信息处理方法、装置、设备及存储介质
CN115544214A (zh) 一种事件处理方法、设备及计算机可读存储介质
US11379929B2 (en) Advice engine
CN111951011B (zh) 监控系统阈值确定方法及装置
CN110659269B (zh) 用户访问数据处理方法、装置、计算机设备及存储介质
US20210042768A1 (en) Synthetic cohort decay analysis and uses thereof
CN110363591B (zh) 一种归属站点识别方法、装置、设备及可读存储介质
CN110602737B (zh) 区域性拆迁识别方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant