CN105989226A - 一种分析用户轨迹的方法及装置 - Google Patents

一种分析用户轨迹的方法及装置 Download PDF

Info

Publication number
CN105989226A
CN105989226A CN201510075261.4A CN201510075261A CN105989226A CN 105989226 A CN105989226 A CN 105989226A CN 201510075261 A CN201510075261 A CN 201510075261A CN 105989226 A CN105989226 A CN 105989226A
Authority
CN
China
Prior art keywords
user
community
time
signaling data
given user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510075261.4A
Other languages
English (en)
Inventor
杨魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201510075261.4A priority Critical patent/CN105989226A/zh
Priority to PCT/CN2015/078220 priority patent/WO2016127507A1/zh
Publication of CN105989226A publication Critical patent/CN105989226A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种分析用户轨迹的方法及装置,该方法包括:对采集到的用户的信令数据进行清洗;根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹,本发明的方法能简单、高效地分析信令数据。

Description

一种分析用户轨迹的方法及装置
技术领域
本发明涉及移动通信及数据挖掘技术领域,特别涉及一种分析用户轨迹的方法及装置。
背景技术
分析用户轨迹可以预测用户位置,挖掘用户移动的行为特征。目前基于信令数据的用户位置分析系统,尤其是在移动通信领域中通过信令数据来挖掘用户轨迹特征、预测用户位置的方法有:第一种,通过用户移动设备上安装终端工具,收集用户一定量的轨迹数据,对其进行抽象化处理,调用PrefixSpan挖掘算法得到基于用户位置信息的运动模式并进行建模,构造模式树(模式树包含所有运动模式及其采用不同起点和终点的概率),同时分析用户在线运动情况得到按照起点和终点位置数据进行组织的运动模式集,将运动模式集结果和挖掘出的运动模式进行匹配和查找来预测用户位置。第二种,通过移动通信网用户无线上网信息采集用户实时位置数据如时间字段信息、地点字段信息,同时对获取到的用户移动数据进行清洗处理,输出一个已处理的用户移动数据信息,并结合根据用户的历史移动行为分析得到的转移概率矩阵,构造马尔科夫模型进行分析计算,从而预测其访问各个地点的可能性,做出用户最大可能访问的地点预测。但这两种方法存在如下缺点:对信令数据采用的分析方法复杂且计算量大,同时缺少对历史数据的优化处理。
发明内容
本发明实施例的目的在于提供一种分析用户轨迹的方法及装置,能简单、高效地分析信令数据。
为了达到上述目的,本发明的实施例提供了一种分析用户轨迹的方法,该方法包括:
对采集到的用户的信令数据进行清洗;
根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
其中,对采集到的用户的信令数据进行清洗的步骤包括:
对采集到的用户的信令数据中的残缺信令数据进行补全;
根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据;
若是错误信令数据,则纠正该错误信令数据;
对纠正后的用户的信令数据进行去重处理。
其中,根据清洗后的信令数据,得到用户的运动轨迹参数的步骤包括:
从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
判断该给定用户进入该小区的平均时间是否在第二预设时间段内;
若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段;
若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户的居住地。
其中,根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据的步骤之后,方法还包括:
判断该给定用户进入该小区的平均时间是否在第四预设时间段内;
若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;
若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该小区为该给定用户的工作地。
其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
本发明的实施例还提供了一种分析用户轨迹的装置,该装置包括:
清洗模块,用于对采集到的用户的信令数据进行清洗;
获得模块,用于根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
确定模块,用于根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
其中,清洗模块包括:
补全单元,用于对采集到的用户的信令数据中的残缺信令数据进行补全;
判断单元,用于根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据,并当补全后的用户的信令数据是错误信令数据时,触发纠正单元;
纠正单元,用于根据判断单元的触发,纠正该错误信令数据;
去重单元,用于对纠正后的用户的信令数据进行去重处理。
其中,获得模块包括:
第一单元,用于从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
第二单元,用于根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
第三单元,用于根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
其中,确定模块包括:
第四单元,用于根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
第五单元,用于判断该给定用户进入该小区的平均时间是否在第二预设时间段内,并当该给定用户进入该小区的平均时间在第二预设时间段内时,触发第六单元;
第六单元,用于根据第五单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段,并当该给定用户在该小区的停留时间覆盖第三预设时间段时,确定该小区为该给定用户的居住地。
其中,确定模块还包括:
第七单元,用于判断该给定用户进入该小区的平均时间是否在第四预设时间段内,并当该给定用户进入该小区的平均时间在第四预设时间段内时,触发第八单元;
第八单元,用于根据第七单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段,并当该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段时,确定该小区为该给定用户的工作地。
其中,确定模块还包括:
第九单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
其中,确定模块还包括:
第十单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
本发明的上述方案至少包括以下有益效果:
在本发明的实施例的分析用户轨迹的方法中,对采集到的用户的信令数据进行清洗,并根据清洗后的信令数据,得到用户的运动轨迹参数,再根据给定用户的唯一标识从用户的运动轨迹参数中确定出该给定用户的轨迹,从而简单、高效地分析信令数据,确定出给定用户的轨迹。
附图说明
图1为本发明实施例中分析用户轨迹的方法的流程图;
图2为本发明实施例中图1中的步骤11的具体步骤流程图;
图3为本发明实施例中图1中的步骤12的具体步骤流程图;
图4为本发明实施例中分析用户轨迹的装置的结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有技术中分析信令数据较复杂的问题,提供了一种分析用户轨迹的方法及装置,能简单、高效地分析信令数据。
如图1所示,本发明的实施例提供了一种分析用户轨迹的方法,该方法包括:
步骤11,对采集到的用户的信令数据进行清洗。
在本发明的具体实施例中,对采集到的用户的信令数据进行清洗可以提高后续数据分析的正确性。
步骤12,根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间。
在本发明的具体实施例中,根据清洗后的信令数据,进行用户轨迹分析。具体地,可以使用PrefixSpan算法对用户的信令数据进行分析,挖掘出用户的居住地,工作地,及用户习惯性的运动轨迹等。
步骤13,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
在本发明的具体实施例中,可根据给定用户的唯一标识,从步骤12中得到的用户的运动轨迹参数中确定出该给定用户的轨迹。
在本发明的具体实施例中,利用PrefixSpan算法分析用户行为轨迹,该分析方法简单高效,以便实现简单、高效地分析信令数据。其中利用PrefixSpan算法分析用户行为轨迹对于本领域的技术人员来说是公知常识,在此不再赘述。
其中,在本发明的上述实施例中,如图2所示,步骤11的具体步骤为:
步骤21,对采集到的用户的信令数据中的残缺信令数据进行补全。
在本发明的具体实施例中,可以通过线性、均值等常见的方式对采集到的用户的信令数据中的残缺信令数据进行补全。在补全的过程中,若出现无法补全的信令数据,则舍弃该信令数据。
步骤22,根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据。
步骤23,若是错误信令数据,则纠正该错误信令数据。
在本发明的具体实施例中,需要根据信令数据规则判断出补全后的信令数据中的错误信令数据,并纠正这些错误的信令数据。在纠正的过程中,若出现无法纠正的信令数据,则舍弃该信令数据。
步骤24,对纠正后的用户的信令数据进行去重处理。
在本发明的具体实施例中,需要去除纠正后的信令数据中的重复的信令数据,以便提高后续数据分析的正确性。
其中,在本发明的上述实施例中,如图3所示,上述步骤12的具体步骤为:
步骤31,从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序。
步骤32,根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间。
在本发明的具体实施例中,从清洗后的信令数据中获取用户每一天的所有信令数据,得到的信令数据的格式可以是{userID,[cellID1,entertime,residenceTime],[cellID2,entertime,residenceTime],…},其中:userID为某用户的唯一标识;cellID1为用户进入此小区的唯一标识;entertime为用户userID进入小区cellID1的进入时间;residenceTime为用户userID进入小区cellID1的停留时间。获得每一天的所有信令数据后,会按照用户进入不同小区在时间的先后顺序对用户信令数据排序,从而得到用户每一天的轨迹。进一步地,还可以对上述每一天的信令数据进行处理得到其它的轨迹参数(例如用户一天中平均进入小区cellID1的进入时间等)。具体地,可以经过分析处理得到如下格式的数据:{userID,[cellID1,firstEntertime,endEntertime,avgEntertime,minResidenceTime,maxResidenceTime],[cellID2,firstEntertime,endEntertime,minResidenceTime,maxResidenceTime,avgResidenceTime],Probability},其中:userID为某用户的唯一标识;cellID1为用户进入此小区的唯一标识;firstEntertime为用户userID一天中最早进入小区cellID1的进入时间;endEntertime为用户userID一天中最晚进入小区cellID1的进入时间;avgEntertime为用户userID一天中平均进入小区cellID1的进入时间;minResidence为用户userID进入小区cellID1的停留最短时间;maxResidence为用户userID进入小区cellID1的停留最长时间;avgResidenceTime为用户userID进入小区cellID1的平均停留时间;Probability为为用户userID已经小区cellID1后,可能会进入小区cellID2的概率。
步骤33,根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
在本发明的具体实施例中,可以根据用户当前的位置,实时更新用户轨迹分析挖掘出来的数据,且对最新(即离当前时刻最近)的数据赋予更高的权重,弱化历史数据的信息,从而为用户轨迹的分析提供最新的可靠信息。
在本发明的具体实施例中,具体的预设天数可根据业务的需求进行调整。接下来以35天为例进行说明。在获得用户UserID在小区cellID1的最近35天的数据后。将35天数据分为5周,计算出用户UserID每周进入小区cellID1的最早进入时间,早进入时间,最晚进入时间、最短停留时间,最长停留时间等,得到的每周的数据为{userID,[cellID1,firstEntertime,endEntertime,avgEntertime,minResidenceTime,maxResidenceTime],对五周数据进行加权处理。计算加权公式可以为:5*最近第一周数据+4*最近第二周数据+3*最近第三周数据+2*最近第四周数据+最近第五周数据/(5+4+3+2+1),根据此公式对历史数据进行了弱化,对最新数据赋予更高的权重。可得到用户userID在小区cellID1最终的最早进入时间,最晚进入时间、最短停留时间,最长停留时间等。可以理解的是,在本发明的实施例中,并不限定加权处理的具体公式,只要对最新的数据赋予更高的权重,弱化历史数据即可。
在本发明的具体实施例中,根据用户的实时位置信息动态调整用户的轨迹参数,提高了确定用户轨迹的精度。
其中,在本发明的具体实施例中,上述步骤13的具体步骤可以为:根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;判断该给定用户进入该小区的平均时间是否在第二预设时间段内;若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段;若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户的居住地。
在本发明的具体实施例中,可以将第一预设时间设为5小时,第二预设时间段设为18点至24点,第三预设时间段设为凌晨1点至凌晨6点,可以理解的是,在本发明的实施例中,并不限定第一预设时间、第二预设时间段以及第三预设时间段的具体数值。
在本发明的具体实施例中,可根据给定用户放入userID,扫描上述分析数据获取此用户在某小区最短停留时间大约5小时的数据,再获取进入此小区的平均进入时间,若平均进入时间为18点至24点,且停留时间可覆盖凌晨1点凌至晨6点的小区,可判断此小区为用户的居住地。
其中,在本发明的具体实施例中,根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据的步骤之后,方法还包括:判断该给定用户进入该小区的平均时间是否在第四预设时间段内;若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该小区为该给定用户的工作地。
在本发明的具体实施例中,可将第四预设时间段设为7点至9点,第五预设时间段设为9点半至11点半,第六预设时间段设为14点半至17点半。可以理解的是,在本发明的实施例中并不限定第四预设时间段、第五预设时间段以及第六预设时间段的具体数值。
在本发明的具体实施例中,可根据给定用户的userID,扫描上述分析数据获取此用户在某小区最短停留时间大约5小时的数据,再获取进入此小区的平均进入时间,若平均进入时间为7点至9点,且停留时间可覆盖9点半至11点半及14点半至17点半的小区,可判断此小区为用户的工作地。
其中,在本发明的上述实施例中,上述步骤13的具体步骤还可以为:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
在本发明的具体实施例中,可根据给定用户的userID、用户当前所在小区的ID以及进入此小区的时间,扫描上述分析数据,获取此用户在此小区的平均停留时间,再根据用户进入该小区的时间,可得到用户可能离开的时间。
其中,在本发明的上述实施例中,上述步骤13的具体步骤还可以为:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
在本发明的具体实施例中,可根据给定用户的userID、用户当前所在小区的ID以及进入此小区的时间,扫描上述分析数据,获取用户接下来最有可能出现在哪个小区。具体地,可从分析数据中的Probability字段中得到在下一小区出现的概率,及在下一小区的停留时间。
为了更好的实现上述目的,如图4所示,本发明的实施例提供了一种分析用户轨迹的装置,该装置包括:
清洗模块41,用于对采集到的用户的信令数据进行清洗;
获得模块42,用于根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
确定模块43,用于根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
其中,清洗模块41包括:
补全单元,用于对采集到的用户的信令数据中的残缺信令数据进行补全;
判断单元,用于根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据,并当补全后的用户的信令数据是错误信令数据时,触发纠正单元;
纠正单元,用于根据判断单元的触发,纠正该错误信令数据;
去重单元,用于对纠正后的用户的信令数据进行去重处理。
其中,获得模块42包括:
第一单元,用于从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
第二单元,用于根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
第三单元,用于根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
其中,确定模块43包括:
第四单元,用于根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
第五单元,用于判断该给定用户进入该小区的平均时间是否在第二预设时间段内,并当该给定用户进入该小区的平均时间在第二预设时间段内时,触发第六单元;
第六单元,用于根据第五单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段,并当该给定用户在该小区的停留时间覆盖第三预设时间段时,确定该小区为该给定用户的居住地。
其中,确定模块43还包括:
第七单元,用于判断该给定用户进入该小区的平均时间是否在第四预设时间段内,并当该给定用户进入该小区的平均时间在第四预设时间段内时,触发第八单元;
第八单元,用于根据第七单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段,并当该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段时,确定该小区为该给定用户的工作地。
其中,确定模块43还包括:
第九单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
其中,确定模块43还包括:
第十单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
需要说明的是,本发明实施例提供的分析用户轨迹的装置是应用上述方法的装置,即上述方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (14)

1.一种分析用户轨迹的方法,其特征在于,包括:
对采集到的用户的信令数据进行清洗;
根据清洗后的信令数据,得到用户的运动轨迹参数,所述运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹。
2.如权利要求1所述的方法,其特征在于,所述对采集到的用户的信令数据进行清洗的步骤包括:
对采集到的用户的信令数据中的残缺信令数据进行补全;
根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据;
若是错误信令数据,则纠正该错误信令数据;
对纠正后的用户的信令数据进行去重处理。
3.如权利要求1所述的方法,其特征在于,所述根据清洗后的信令数据,得到用户的运动轨迹参数的步骤包括:
从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,所述每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
4.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
根据给定用户的唯一标识,通过扫描所述用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
判断该给定用户进入该小区的平均时间是否在第二预设时间段内;
若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段;
若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户的居住地。
5.如权利要求4所述的方法,其特征在于,所述根据给定用户的唯一标识,通过扫描所述用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据的步骤之后,所述方法还包括:
判断该给定用户进入该小区的平均时间是否在第四预设时间段内;
若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;
若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该小区为该给定用户的工作地。
6.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
7.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
8.一种分析用户轨迹的装置,其特征在于,包括:
清洗模块,用于对采集到的用户的信令数据进行清洗;
获得模块,用于根据清洗后的信令数据,得到用户的运动轨迹参数,所述运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
确定模块,用于根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹。
9.如权利要求8所述的装置,其特征在于,所述清洗模块包括:
补全单元,用于对采集到的用户的信令数据中的残缺信令数据进行补全;
判断单元,用于根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据,并当补全后的用户的信令数据是错误信令数据时,触发纠正单元;
纠正单元,用于根据所述判断单元的触发,纠正该错误信令数据;
去重单元,用于对纠正后的用户的信令数据进行去重处理。
10.如权利要求8所述的装置,其特征在于,所述获得模块包括:
第一单元,用于从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
第二单元,用于根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,所述每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
第三单元,用于根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
11.如权利要求8所述的装置,其特征在于,所述确定模块包括:
第四单元,用于根据给定用户的唯一标识,通过扫描所述用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
第五单元,用于判断该给定用户进入该小区的平均时间是否在第二预设时间段内,并当该给定用户进入该小区的平均时间在第二预设时间段内时,触发第六单元;
第六单元,用于根据所述第五单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段,并当该给定用户在该小区的停留时间覆盖第三预设时间段时,确定该小区为该给定用户的居住地。
12.如权利要求11所述的装置,其特征在于,所述确定模块还包括:
第七单元,用于判断该给定用户进入该小区的平均时间是否在第四预设时间段内,并当该给定用户进入该小区的平均时间在第四预设时间段内时,触发第八单元;
第八单元,用于根据所述第七单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段,并当该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段时,确定该小区为该给定用户的工作地。
13.如权利要求8所述的装置,其特征在于,所述确定模块还包括:
第九单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
14.如权利要求8所述的装置,其特征在于,所述确定模块还包括:
第十单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
CN201510075261.4A 2015-02-12 2015-02-12 一种分析用户轨迹的方法及装置 Pending CN105989226A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510075261.4A CN105989226A (zh) 2015-02-12 2015-02-12 一种分析用户轨迹的方法及装置
PCT/CN2015/078220 WO2016127507A1 (zh) 2015-02-12 2015-05-04 一种分析用户轨迹的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510075261.4A CN105989226A (zh) 2015-02-12 2015-02-12 一种分析用户轨迹的方法及装置

Publications (1)

Publication Number Publication Date
CN105989226A true CN105989226A (zh) 2016-10-05

Family

ID=56614245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510075261.4A Pending CN105989226A (zh) 2015-02-12 2015-02-12 一种分析用户轨迹的方法及装置

Country Status (2)

Country Link
CN (1) CN105989226A (zh)
WO (1) WO2016127507A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106792514A (zh) * 2016-11-30 2017-05-31 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN107948738A (zh) * 2016-10-13 2018-04-20 北京国双科技有限公司 一种网络电视去重用户数的计算方法及装置
CN110572813A (zh) * 2018-05-19 2019-12-13 北京融信数联科技有限公司 一种基于移动大数据的手机用户行为相似度分析方法
CN110837528A (zh) * 2019-11-15 2020-02-25 智慧足迹数据科技有限公司 人口统计方法、装置及服务器
CN110958558A (zh) * 2018-09-26 2020-04-03 北京融信数联科技有限公司 一种基于移动大数据的手机用户时空轨迹刻画方法
CN111372234A (zh) * 2018-12-25 2020-07-03 北京融信数联科技有限公司 一种手机用户乒乓切换智能化判定方法
CN111417075A (zh) * 2018-12-18 2020-07-14 北京融信数联科技有限公司 一种基于移动通信大数据的用户工作地识别方法
CN111669710A (zh) * 2020-04-21 2020-09-15 上海因势智能科技有限公司 人口统计去重方法
CN111680059A (zh) * 2020-04-29 2020-09-18 国家计算机网络与信息安全管理中心 基于特定区域的活跃人员、常驻人员的分析方法及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112561759B (zh) * 2020-01-02 2023-08-04 北京融信数联科技有限公司 一种基于移动信令大数据的毕业生去向动态监测方法
CN111578933B (zh) * 2020-05-09 2022-03-11 北京上下文系统软件有限公司 一种快速识别用户进入特定地理区域内的方法
CN113537879B (zh) * 2021-06-28 2022-12-06 深圳市盈捷创想科技有限公司 基于大数据的物品派发方法、装置和计算机可读存储介质
CN116033354B (zh) * 2022-12-16 2023-07-21 中科世通亨奇(北京)科技有限公司 一种用户位置属性信息的分析方法及系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020160805A1 (en) * 2001-02-27 2002-10-31 Nokia Corporation Push content filtering
CN101146262A (zh) * 2007-10-23 2008-03-19 中兴通讯股份有限公司 一种移动用户长期活动区域信息生成的方法及系统
CN102075850A (zh) * 2009-11-19 2011-05-25 中国移动通信集团吉林有限公司 确定移动用户职业信息的方法及其装置
CN102682041A (zh) * 2011-03-18 2012-09-19 日电(中国)有限公司 用户行为识别设备及方法
CN103096371A (zh) * 2013-01-16 2013-05-08 上海大唐移动通信设备有限公司 一种室内用户的识别方法和系统
CN103227821A (zh) * 2013-04-03 2013-07-31 腾讯科技(深圳)有限公司 一种目标用户位置数据的处理方法及装置
CN103354633A (zh) * 2013-07-31 2013-10-16 上海欣方软件有限公司 基于信令数据挖掘分析的特定移动用户粗定位系统及方法
CN104348635A (zh) * 2013-07-24 2015-02-11 中国移动通信集团福建有限公司 一种移动用户行为分析方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010126412A1 (en) * 2009-04-28 2010-11-04 Telefonaktiebolaget Lm Ericsson (Publ) Predicting presence of a mobile user equipment
CN103052022B (zh) * 2011-10-17 2015-08-19 中国移动通信集团公司 基于移动行为的用户稳定点发现方法和系统
CN103731916B (zh) * 2014-01-14 2017-07-07 上海河广信息科技有限公司 一种基于无线网络的用户位置预测系统和方法
CN103914563A (zh) * 2014-04-18 2014-07-09 中国科学院上海微系统与信息技术研究所 一种时空轨迹的模式挖掘方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020160805A1 (en) * 2001-02-27 2002-10-31 Nokia Corporation Push content filtering
CN101146262A (zh) * 2007-10-23 2008-03-19 中兴通讯股份有限公司 一种移动用户长期活动区域信息生成的方法及系统
CN102075850A (zh) * 2009-11-19 2011-05-25 中国移动通信集团吉林有限公司 确定移动用户职业信息的方法及其装置
CN102682041A (zh) * 2011-03-18 2012-09-19 日电(中国)有限公司 用户行为识别设备及方法
CN103096371A (zh) * 2013-01-16 2013-05-08 上海大唐移动通信设备有限公司 一种室内用户的识别方法和系统
CN103227821A (zh) * 2013-04-03 2013-07-31 腾讯科技(深圳)有限公司 一种目标用户位置数据的处理方法及装置
CN104348635A (zh) * 2013-07-24 2015-02-11 中国移动通信集团福建有限公司 一种移动用户行为分析方法和装置
CN103354633A (zh) * 2013-07-31 2013-10-16 上海欣方软件有限公司 基于信令数据挖掘分析的特定移动用户粗定位系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈德美: ""运营商信息服务的商业模式创新及其应用研究"", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107948738A (zh) * 2016-10-13 2018-04-20 北京国双科技有限公司 一种网络电视去重用户数的计算方法及装置
CN107948738B (zh) * 2016-10-13 2020-10-20 北京国双科技有限公司 一种网络电视去重用户数的计算方法及装置
CN106792514A (zh) * 2016-11-30 2017-05-31 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN106792514B (zh) * 2016-11-30 2020-10-30 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN110572813A (zh) * 2018-05-19 2019-12-13 北京融信数联科技有限公司 一种基于移动大数据的手机用户行为相似度分析方法
CN110958558A (zh) * 2018-09-26 2020-04-03 北京融信数联科技有限公司 一种基于移动大数据的手机用户时空轨迹刻画方法
CN111417075A (zh) * 2018-12-18 2020-07-14 北京融信数联科技有限公司 一种基于移动通信大数据的用户工作地识别方法
CN111417075B (zh) * 2018-12-18 2023-06-06 北京融信数联科技有限公司 一种基于移动通信大数据的用户工作地识别方法
CN111372234A (zh) * 2018-12-25 2020-07-03 北京融信数联科技有限公司 一种手机用户乒乓切换智能化判定方法
CN110837528A (zh) * 2019-11-15 2020-02-25 智慧足迹数据科技有限公司 人口统计方法、装置及服务器
CN111669710A (zh) * 2020-04-21 2020-09-15 上海因势智能科技有限公司 人口统计去重方法
CN111680059A (zh) * 2020-04-29 2020-09-18 国家计算机网络与信息安全管理中心 基于特定区域的活跃人员、常驻人员的分析方法及系统
CN111680059B (zh) * 2020-04-29 2023-08-15 国家计算机网络与信息安全管理中心 基于特定区域的活跃人员、常驻人员的分析方法及系统

Also Published As

Publication number Publication date
WO2016127507A1 (zh) 2016-08-18

Similar Documents

Publication Publication Date Title
CN105989226A (zh) 一种分析用户轨迹的方法及装置
CN104713568A (zh) 步态识别方法以及相应的计步器
CN106792456A (zh) 数据分析系统和方法
CN106489101A (zh) 太阳能板清洁系统的预测性维护和推断模式
CN103888961B (zh) 一种用户监控方法及装置
CN111179457A (zh) 一种工业设备的巡检系统及巡检方法
CN110019124B (zh) 一种集合天气预报修订方法及系统
CN116543560B (zh) 一种基于深度学习的智能路况预测系统及方法
CN111026738A (zh) 区域人口监控方法、系统、电子设备及存储介质
CN111191400B (zh) 基于用户报障数据的车辆零部件寿命预测方法及系统
CN108182446A (zh) 一种基于聚类算法的司机常驻地预测方法及装置
CN110516866A (zh) 一种用于城市轨交地铁拥挤度的实时估计方法
CN113177774A (zh) 基于bim的建筑施工监管方法
CN116505663B (zh) 一种农场用电安全状态监测预警系统
CN113361825A (zh) 一种踩踏事故早期预警方法及系统
CN114842349B (zh) 一种基于信息技术的建筑施工环境保护方法和系统
CN111048208A (zh) 一种基于激光雷达的室内独居老人行走健康检测方法
CN116448161A (zh) 一种基于人工智能的环境监测设备故障诊断方法
CN113349188B (zh) 一种基于云端杀草谱的草坪及牧草精准除草方法
CN116822115A (zh) 一种基于数字孪生技术的智慧园区的环境管理方法及系统
CN108062603A (zh) 基于配电自动化终端设备全生命周期寿命预测方法及系统
CN114417981A (zh) 一种智能河长巡测系统
CN105307262A (zh) 一种伪基站的定位方法及装置
CN117421692A (zh) 垃圾投放站的垃圾违规投放识别方法、装置、设备
CN115936680B (zh) 一种设备运维的智能派单方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161005