CN103052022B - 基于移动行为的用户稳定点发现方法和系统 - Google Patents

基于移动行为的用户稳定点发现方法和系统 Download PDF

Info

Publication number
CN103052022B
CN103052022B CN201110315058.1A CN201110315058A CN103052022B CN 103052022 B CN103052022 B CN 103052022B CN 201110315058 A CN201110315058 A CN 201110315058A CN 103052022 B CN103052022 B CN 103052022B
Authority
CN
China
Prior art keywords
point
user
mobile behavior
time
base station
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110315058.1A
Other languages
English (en)
Other versions
CN103052022A (zh
Inventor
吴晶
胡可云
陶振武
颜红燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201110315058.1A priority Critical patent/CN103052022B/zh
Publication of CN103052022A publication Critical patent/CN103052022A/zh
Application granted granted Critical
Publication of CN103052022B publication Critical patent/CN103052022B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种基于移动行为的用户稳定点发现方法及系统,其中,该方法包括:1)生成结构化的用户位置切换数据信息;2)以时间为序将用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;3)合并得到新的空间移动行为轨迹序列;4)如果用户在该小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则位置点为该用户的稳定点。本发明的基于移动行为的用户稳定点发现方法和系统,突出用户移动行为轨迹数据的时间和空间规律,从而利用时段划分的方式发现用户在不同时间段的稳定点分布,提升识别精度和适用范围。

Description

基于移动行为的用户稳定点发现方法和系统
技术领域
本发明涉及通信领域中业务支撑的技术,具体地,涉及基于移动行为的用户稳定点发现方法及系统。
背景技术
随着移动通信设备的普及,移动网络中基于位置信息的服务(LBS,Location Based Service)越来越成为热点。移动用户的位置信息可描述用户移动轨迹,结合用户身份更容易契合实际消费和需求模式,其巨大的市场规模和良好的应用前景正成为全球各大运营商和科研机构关注的焦点。从移动运营商的角度,分析用户群体的时空行为信息,可以得到更为准确细致的人群分布以及行为习惯模式,从而提供更为贴心及时的个性化服务。因此,基于移动行为的数据挖掘、关系识别、精准营销等都是具有战略意义的课题。其中,如何根据用户的移动行为发现其稳定点分布既是分析基础也是提升性能的优化方向。
用户稳定点指人群在日常移动行为中,停留时间较长并具有明显时间规律的位置点,典型的稳定点包括:居住地(O,origin)和工作地(D,destination),以下将居住地和工作地简称为OD。移动运营商积累了海量的用户移动行为数据,但基于这些大规模时空数据开展的研究和支撑应用还不深入,成果还不够丰富。研究不同类型的移动用户在时间和空间上的行为规律,可以挖掘出其时空的稳定点,并结合用户属性和通信记录深入剖析其个性或群体特征,这对移动增值服务应用十分有价值。
在现有技术中,面向移动领域的用户稳定点发现方法尚未成型,多是面向特定领域的OD识别策略和方法,未考虑利用移动通信行为特征和大规模时空数据处理机制,难以在移动领域直接复用。
经归纳整理,与本发明相关的现有技术方案主要包含以下几种:
1、交通调查方式获取用户稳定点。该方案主要通过周期性的大范围交通问卷或者上门调查(2-5年为一周期)的方式获取用户的信息,包括工作地、居住地、常去的地点、出行时间等与用户稳定点密切相关的信息。此外,也有通过在部分区域间的小范围抽样,估计不同区域间的用户移动规律和稳定用户个数来获取用户稳定点的方法,在城市交通规划、建设管理方面应用较为广泛。
2、GPS数据获取用户稳定点。该方案主要利用了用户智能手机的GPS定位功能,周期性(1分钟-1小时)记录该手机的位置点信息,形成用户的行为轨迹模式,并从中得到用户的稳定点信息。该方案得到用户的位置信息一般较为精确,但易受手机终端、计算规模和室内空间等限制,普及率低。
3、泊点发现朴素算法。该算法引入了用户历史通话数据,先对用户进行过滤,删除通话次数较少的用户,再将通话时段粗略划分为白天与夜晚,分别选取通话次数最多的基站作为泊点,该算法只利用了通话数据的频次特征,对于用户非频繁行为、通话数据稀缺等情况,表达能力不足,不能完全适用移动应用场景。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
1、传统方案成本代价高、实施周期长、采样率低,难以全面覆盖,继而无法同时保证精度和及时性;
2、现有方案未考虑充分发挥海量用户移动行为数据的价值,特别是通信数据和位置切换数据的时空特性;
3、现有方案多基于特定应用场景进行稳定点分析,缺乏适用于移动领域的通用解决方案。
发明内容
本发明的目的是针对现有技术中用户稳定点的发现方法精度较低的缺陷,提出一种基于移动行为的用户稳定点发现方法及系统。
为实现上述目的,根据本发明的一个方面,提供了一种基于移动行为的用户稳定点发现方法。
根据本发明实施例的基于移动行为的用户稳定点发现方法,包括:
将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;
以时间为序将用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;
利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除空间移动行为轨迹序列中的异常位置点,合并得到新的空间移动行为轨迹序列;
在新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则位置点为该用户的稳定点。
在上述技术方案中,确定正常位置点为该用户的稳定点的条件还包括:
用户在异常位置点的停留时间未超过总停留时间的预设比例值。
在上述技术方案中,预设区间值为50%-100%。
在上述技术方案中,预设比例值为50%。
在上述技术方案中,利用基站摆动对的策略去除空间移动行为轨迹序列中的异常位置点的步骤具体包括:
基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对基站摆动对进行合并处理。
在上述技术方案中,利用相同经纬度点合并的策略去除空间移动行为轨迹序列中的异常位置点的步骤具体包括:
判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的新的小区编码进行合并处理。
在上述技术方案中,利用限制通行能力的策略去除空间移动行为轨迹序列中的异常位置点的步骤具体包括:
空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。
在上述技术方案中,在
在合并得到新的空间移动行为轨迹序列的步骤与选择停留时间最长的小区编码的步骤之间还包括:
增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
为实现上述目的,根据本发明的另一个方面,提供了一种基于移动行为的用户稳定点发现系统。
根据本发明实施例的基于移动行为的用户稳定点发现系统,包括:
数据清洗转换模块,用于将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;
移动行为轨迹提取模块,用于以时间为序将用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列;
位置信息融合优化模块,用于利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除空间移动行为轨迹序列中的异常位置点,合并得到新的空间移动行为轨迹序列;
稳定点发现模块,用于在新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则位置点为该用户的稳定点。
在上述技术方案中,在稳定点发现模块中,确定正常位置点为该用户的稳定点的条件还包括:用户在异常位置点的停留时间未超过总停留时间的预设比例值。
在上述技术方案中,在稳定点发现模块中,预设区间值为50%-100%。
在上述技术方案中,在稳定点发现模块中,预设比例值为50%。
在上述技术方案中,位置信息融合优化模块包括:
摆动对确定合并子模块,用于基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对基站摆动对进行合并处理。
在上述技术方案中,位置信息融合优化模块包括:
经纬度合并子模块,用于判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的新的小区编码进行合并处理。
在上述技术方案中,位置信息融合优化模块包括:
限制通行能力子模块,用于空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。
在上述技术方案中,位置信息融合优化模块还包括:
频繁度优化子模块,用于增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
本发明的基于移动行为的用户稳定点发现方法和系统,基于具有时空特性的用户移动行为轨迹,充分发挥海量用户移动行为数据(特别是通信数据和位置切换数据)价值,通过用户移动行为轨迹提取和位置信息融合优化策略,突出用户移动行为轨迹数据的时间和空间规律,从而利用时段划分的方式发现用户在不同时间段的稳定点分布,提升识别精度和适用范围。
本发明的基于移动行为的用户稳定点发现方法和系统,利用基站摆动对、相同经纬度点合并、限制通行能力以及基站频繁度增强等策略消除通信中非频繁行为和数据稀疏的影响,并去除大规模数据中的异常点和歧义点。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为根据本发明实施例的基于移动行为的用户稳定点发现系统的系统架构示意图;
图2为根据本发明实施例的时间标签Timestamp的示例截图;
图3为根据本发明实施例涉及基站摆动对的Voronoi图;
图4为根据本发明实施例的基于移动行为的用户稳定点发现的方法流程图;
图5为根据本发明实施例的基于移动行为的用户稳定点发现系统的结构示意图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本发明提出了一种基于移动行为的用户稳定点发现方法和系统,其系统架构如图1所示,该系统逻辑上分为数据层、处理层和挖掘层,具体包括:
1、数据层:
a)用户位置切换数据:以CELL为粒度记录用户在不同位置之间的切换,可从移动A接口网络信令侧采集,只要用户的手机处于开机状态,位置信息就被记录。数据说明如表1所示:
表1
需要说明的是,上述移动A接口指移动业务交换中心与基站控制器之间的接口,是采集用户位置切换数据的基础。
b)用户交往通信记录:指移动用户间通信服务使用记录明细,可从移动运营商的BOSS(业务运营支撑系统)系统直接采集,一般作为位置更新事件的补充数据;包括主叫号码、被叫号码、呼叫次数、呼叫时长、忙时(闲时、周末)呼叫(呼出)次数及时长、短信次数、忙时(闲时、周末)短信次数等;
c)基站信息:特指基站Cell地区分布映射情况,如记录370,03ec,64,115.63710,34.43351,对应的数据说明如表2所示:
表2
  字段标识   字段说明
  Area_code   地区编码(如370)
  Cell_id   小区编码(如03ec)
  Bts_id   基站编码(如64)
  Bts_lon   基站经度(如115.63710)
  Bts_lat   基站纬度(如34.43351)
2、处理层:
a)数据清洗转换模块
完成源数据读取、完整性校验以及去除冗余和具有明显错误数据的操作(可基于实体完整性和参照完整性等原则进行处理),并将清洗后的数据按照系统任务要求进行结构化抽取转换,该模块是高效处理海量数据的基础保证。
b)移动行为轨迹提取模块
用户位置切换数据体现了每个用户的时空行为特性,用户连续的位置切换信息可看作以CELL为粒度的用户连续行为轨迹,因此该模块主要工作是以Phone_num为单位将位置切换数据以时间为序进行排列,抽取出每一用户的空间上的移动行为轨迹序列。
现有的抽取中面临的主要问题是通信过程中存在自然或非自然关机的情况,从而导致用户轨迹有异常间断现象;本发明的解决思路是:当Event_type为51时,将Cell_id标注为未知(在轨迹序列中用特殊符号表示),Event_time记录用户关机时间,再进行后续特殊处理。
移动行为轨迹提取模块输出的数据结果是每个用户按时间排序的移动行为轨迹,包括Cell_id和未知两类标识,并含有一个时间标签Timestamp,其数据结构如表3所示,示例截图如图2所示。位置点的停留时间可以通过用户进入这个位置点的时间与进入下一个位置点的时间差得到,其以时间粒度(1小时,15分钟等)划分,用于比较两个用户出现在同一个基站区的时间轨迹。
表1
  Phone_numA   TimestampA   Cell_id1   Cell_id2 ......
  Phone_numB   TimestampB   Cell_id1   Cell_id2 ......
c)位置信息融合优化模块
该模块主要实现将用户移动行为轨迹中的异常点和歧义点去除,利用位置信息和通话数据融合优化,提升基于移动行为的稳定点发现的准确性,可从空间和时间两个维度进行信息融合以及优化改进:
空间改进
由于信号强度影响或者用户所处位置在几个基站的共同覆盖区域内,用户行为轨迹中的位置点(包括用户自身固定不动的位置点记录)可能经常在几个相邻的位置之间切换,通话数据分散,这种现象称作是基站的摆动效应。本发明的解决思路是:基于Voronoi图(又称泰森多边形或Dirichlet图,如图3所示)的基站相邻关系或基站空间距离(基站邻接且距离小于1km),找到互相切换的基站摆动对,将相邻基站合并到频繁度高的位置区即可。摆动对的切换需要满足以下两个条件:
(1)切换时间间隔在1小时内;
(2)基站空间距离不超过1km;
对满足以上频繁切换条件的基站摆动对(Cell_A,Cell_B),可以按照基站出现频繁度优先原则合并;如移动行为轨迹数据按照(Cell_A,Cell_B,Cell_A)摆动切换,可将它用位置点Cell_A表示。
此外,还要考虑不同的Cell_id可能对应相同经纬度的情况;通常一个基站发射器上部署3个Cell,因而同一个位置会有3个Cell_id。可以利用以上方法对相邻基站进行合并优化,或将经纬度相同的Cell_id重新定义新的ID,再将连续两个位置点是同一新ID的记录进行合并,产生新的移动行为轨迹数据。
时间改进
泊点发现朴素算法利用了通话数据的基站频次特征来过滤数据,即基站频繁度F=T,T为基站的通话次数,由于移动应用场景下用户移动行为分布规律并不突出,单一的阈值设定难以区分和过滤频繁度高的区域。因此,本发明考虑了用户非频繁行为、通话数据稀缺等情况,利用基站通话的时间规律,通过加权修正的方法对朴素算法中的F进一步进行优化改进。
首先定义:
基站通话频率r:基站发生通话的天数占总天数的比例(r>0)
通话次数下限m:基站每天通话次数的最低值(不包括无通话的天数,m>=1)
修正后的基站频繁度F’=T×r×m可作为过滤阈值,通过增强通话频率高且通话次数下限高的基站区频繁度,得到周期性规律更显著的基站区域并在用户移动行为轨迹数据中进行标记,消除了非频繁行为以及稀疏数据的影响。
此外,由于移动通信设备不稳定和信号传输异常的原因,用户移动行为轨迹中经常会出现不符合时空规律的异常点或歧义点。本发明中的异常数据清洗的解决思路是:定义用户限制通行能力阈值MaxSpeed,该约束阈值MaxSpeed可根据实际交通出行情况进行设置,如城市用户多为驾驶出行,MaxSpeed可设为100km/h。如果行为轨迹记录用户在进入一个位置点Cell_At时间后到达下一个位置点Cell_B,计算AB两点间距离若大于t*MaxSpeed,则Cell_B信息出现异常,可标识为未知。
3、挖掘层
稳定点发现模块
稳定点发现模块的输入数据来自移动行为轨迹提取模块和位置信息融合优化模块,即清洗了异常和歧义的具有时空特征的用户移动行为轨迹数据。可以在此基础上,通过划分时间段的方式发现用户在不同时间段的稳定点,并根据用户的生活习惯,得到用户的居住地和工作地,及其它常去的稳定点。
广义上可将时间划分为以下三段:
休息时间段(在家为主,每天晚上22点到第二天上午6点):大部分用户都在家中,统计每个用户移动行为轨迹中该时段的Cell_id和Timestamp,选择停留时间最长的Cell_id;如果用户在该位置点停留时间占总停留时间的50%-100%,且停留在未知位置点(即手机关机和异常情况)的比例不超过总停留时间的50%,则认为该位置点是该用户在休息时间段的稳定点,可以等同于该用户的居住地0。
工作时间段(在单位为主,工作日早上9点到下午17点):大部分用户都在单位中,统计每个用户移动行为轨迹中该时段的Cell_id和Timestamp,选择停留时间最长的Cell_id。如果用户在该位置点停留时间占总停留时间的50%-100%,而且停留在未知位置点(即手机关机和异常情况)的比例不超过总停留时间的50%,则认为该位置点是该用户在工作时间段的稳定点,可以等同于该用户的工作地D。
其它时间段(双休日早上9点到晚上20点,工作日下午18点到晚上22点):过滤用户居住地和工作地的数据,统计每个用户移动行为轨迹中该时段的Cell_id和Timestamp;如果用户在某些位置点停留时间超过一定阈值(可根据判别条件设定),可以将这些位置点看作用户的其它稳定点。
稳定点OD对应的数据说明如表4所示:
表4
  字段标识   字段说明
  Phone_num   用户号码
  OCell_id   O位置编码
  OCell_lon   O位置经度
  OCell_lat   O位置纬度
  DCell_id   D位置编码
  DCell_lon   D位置经度
  DCell_lat   D位置纬度
方法实施例
根据本发明实施例,提供了一种基于移动行为的用户稳定点发现方法,图4为根据本发明实施例的基于移动行为的用户稳定点发现的方法流程图。如图4所示,本实施例包括:
步骤1:将所有用户的原始位置切换数据、用户交往通信记录和基站信息(含经纬度)进行结构化处理,转化为结构化的用户位置切换数据<Phone_num,Cell_id,Event_type,Event_time>;
步骤2:以Phone_num为单位将位置切换数据以时间为序进行排列,抽取出每一用户的空间上的移动行为轨迹序列,包括Cell_id和未知两类标识,并含有一个时间标签Timestamp;
步骤3-4组合:利用基站摆动对、相同经纬度合并、限制通行能力等策略去除大规模数据中的异常点和歧义点,得到进一步合并的新的移动行为轨迹数据,该过程可结合实际数据情况并行处理完成,具体包括以下三个分支:
分支1(步骤3-步骤4):基于Voronoi图的基站相邻关系或基站空间距离(判断基站是否邻接且距离小于1km),找到互相切换的基站摆动对,将相邻基站合并到频繁度高的位置区,得到去除冗余位置信息的新的移动行为轨迹数据;
分支2(步骤3’-步骤4’):判断不同的Cell_id是否对应相同的经纬度,将经纬度相同的Cell_id重新定义为新的ID,再将连续两个位置点是同一新ID的记录进行合并,合并产生新的移动行为轨迹数据;
分支3(步骤3”-步骤4”):定义用户限制通行能力阈值MaxSpeed,如果行为轨迹记录用户在进入一个位置点Cell_At时间后到达下一个位置点Cell_B,计算AB两点间距离若大于t*MaxSpeed,则Cell_B信息出现异常,可标识为未知,合并产生新的移动行为轨迹数据;
步骤5:优化基站频繁度F’=T×r×m可作为过滤阈值,通过增强通话频率高且通话次数下限高的基站区频繁度,得到周期性规律更显著的基站区域并在用户移动行为轨迹中进行标记,消除通信中非频繁行为和数据稀疏的影响,得到优化后的具有时空特性的用户移动行为轨迹;
步骤6-7:统计每个用户移动行为轨迹中在典型时段(早中晚)的Cell_id和Timestamp,选择停留时间最长的Cell_id,如果用户在该位置点停留时间占总停留时间的50%-100%,且停留在未知位置点(即手机关机和异常情况)的比例不超过总停留时间的50%,则认为该位置点是该用户在该时间段的稳定点。
本发明的基于移动行为的用户稳定点发现方法,基于具有时空特性的用户移动行为轨迹,充分发挥海量用户移动行为数据(特别是通信数据和位置切换数据)价值,通过用户移动行为轨迹提取和位置信息融合优化策略,突出用户移动行为轨迹数据的时间和空间规律,从而利用时段划分的方式发现用户在不同时间段的稳定点分布,提升识别精度和适用范围。
本发明的基于移动行为的用户稳定点发现方法,利用基站摆动对、相同经纬度点合并、限制通行能力以及基站频繁度增强等策略消除通信中非频繁行为和数据稀疏的影响,并去除大规模数据中的异常点和歧义点。
系统实施例
根据本发明实施例,提供了一种基于移动行为的用户稳定点发现系统。图5为根据本发明实施例的基于移动行为的用户稳定点发现系统的结构示意图,如图5所示,本实施例包括:
数据清洗转换模块10:
a)输入:数据层源数据,包括所有用户的原始位置切换数据、用户交往通信记录和基站信息(含经纬度);
b)输出:结构化的用户位置切换数据、用户交往通信记录和基站信息;
移动行为轨迹提取模块20:
a)输入:结构化的用户位置切换数据<Phone_num,Cell_id,Event_type,Event_time>;
b)输出:每个用户按时间排序的移动行为轨迹,包括Cell_id和未知两类标识,并含有一个时间标签Timestamp;
位置信息融合优化模块30:
a)输入:每个用户按时间排序的移动行为轨迹,每个Cell_id的具体位置信息及每个用户基站通信记录;
b)输出:合并优化后的具有时空特性的用户移动行为轨迹;
稳定点发现模块40:
a)输入:合并优化后的具有时空特性的用户移动行为轨迹,稳定点判别条件;
b)输出:每个用户的稳定点信息。
其中,位置信息融合优化模块30包括:
摆动对确定合并子模块31,用于基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对基站摆动对进行合并处理;
经纬度合并子模块32,用于判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的所述新的小区编码进行合并处理;
限制通行能力子模块33,用于空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点;
频繁度优化子模块34,用于增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
本发明的基于移动行为的用户稳定点发现系统,基于具有时空特性的用户移动行为轨迹,充分发挥海量用户移动行为数据(特别是通信数据和位置切换数据)价值,通过用户移动行为轨迹提取和位置信息融合优化策略,突出用户移动行为轨迹数据的时间和空间规律,从而利用时段划分的方式发现用户在不同时间段的稳定点分布,提升识别精度和适用范围。
本发明的基于移动行为的用户稳定点发现系统,利用基站摆动对、相同经纬度点合并、限制通行能力以及基站频繁度增强等策略消除通信中非频繁行为和数据稀疏的影响,并去除大规模数据中的异常点和歧义点。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种基于移动行为的用户稳定点发现方法,其特征在于,包括:
将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;
以时间为序将所述用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列,所述空间移动行为轨迹序列包括小区编码和未知两类标识,并含有一个时间标签;
利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除所述空间移动行为轨迹序列中的异常位置点,合并得到新的空间移动行为轨迹序列;
在所述新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果所述用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则所述位置点为该用户的稳定点。
2.根据权利要求1所述的方法,其特征在于,确定所述正常位置点为该用户的稳定点的条件还包括:
所述用户在异常位置点的停留时间未超过总停留时间的预设比例值。
3.根据权利要求1或2所述的方法,其特征在于,利用基站摆动对的策略去除所述空间移动行为轨迹序列中的异常位置点的步骤具体包括:
基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对所述基站摆动对进行合并处理。
4.根据权利要求1或2所述的方法,其特征在于,利用相同经纬度点合并的策略去除所述空间移动行为轨迹序列中的异常位置点的步骤具体包括:
判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的所述新的小区编码进行合并处理。
5.根据权利要求1或2所述的方法,其特征在于,利用限制通行能力的策略去除所述空间移动行为轨迹序列中的异常位置点的步骤具体包括:
所述空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。
6.根据权利要求1或2所述的方法,其特征在于,在合并得到新的空间移动行为轨迹序列的步骤与选择停留时间最长的小区编码的步骤之间还包括:
增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
7.一种基于移动行为的用户稳定点发现系统,其特征在于,包括:
数据清洗转换模块,用于将用户的原始位置切换数据、用户交往通信记录和基站信息进行结构化处理,生成结构化的用户位置切换数据信息;
移动行为轨迹提取模块,用于以时间为序将所述用户位置切换数据信息进行排列,抽取出每位用户的空间移动行为轨迹序列,所述空间移动行为轨迹序列包括小区编码和未知两类标识,并含有一个时间标签;
位置信息融合优化模块,用于利用基站摆动对、相同经纬度点合并和/或限制通行能力的策略去除所述空间移动行为轨迹序列中的异常位置点,合并得到新的空间移动行为轨迹序列;
稳定点发现模块,用于在所述新的空间移动行为轨迹序列中选择停留时间最长的小区编码,如果所述用户在已选择的停留时间最长的小区编码所代表的正常位置点停留时间占总停留时间达到预设区间值,则所述位置点为该用户的稳定点。
8.根据权利要求7所述的系统,其特征在于,在所述稳定点发现模块中,确定所述正常位置点为该用户的稳定点的条件还包括:所述用户在异常位置点的停留时间未超过总停留时间的预设比例值。
9.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块包括:
摆动对确定合并子模块,用于基于泰森多边形中的基站相邻关系或基站空间距离,确定相互切换的基站摆动对,并对所述基站摆动对进行合并处理。
10.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块包括:
经纬度合并子模块,用于判断新的空间移动行为轨迹序列中不同的小区编码是否对应相同的经纬度,将经纬度相同的小区编码定义为新的小区编码,再将连续两个位置点为相同的所述新的小区编码进行合并处理。
11.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块包括:
限制通行能力子模块,用于所述空间移动行为轨迹序列中的用户在进入第一位置点一段时间后进入第二位置点,如果第一位置点与第二位置点之间的距离大于设定的异常距离值,则将第二位置点设定为异常位置点。
12.根据权利要求7或8所述的系统,其特征在于,所述位置信息融合优化模块还包括:
频繁度优化子模块,用于增强通话频率高且通话次数下限高的基站频繁度,得到周期性显著的基站区域并在空间移动行为轨迹序列中进行标记,并得到优化后的具有时空特性的空间移动行为轨迹序列。
CN201110315058.1A 2011-10-17 2011-10-17 基于移动行为的用户稳定点发现方法和系统 Active CN103052022B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110315058.1A CN103052022B (zh) 2011-10-17 2011-10-17 基于移动行为的用户稳定点发现方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110315058.1A CN103052022B (zh) 2011-10-17 2011-10-17 基于移动行为的用户稳定点发现方法和系统

Publications (2)

Publication Number Publication Date
CN103052022A CN103052022A (zh) 2013-04-17
CN103052022B true CN103052022B (zh) 2015-08-19

Family

ID=48064496

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110315058.1A Active CN103052022B (zh) 2011-10-17 2011-10-17 基于移动行为的用户稳定点发现方法和系统

Country Status (1)

Country Link
CN (1) CN103052022B (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104348635A (zh) * 2013-07-24 2015-02-11 中国移动通信集团福建有限公司 一种移动用户行为分析方法和装置
CN104581622B (zh) 2013-10-28 2018-09-07 华为技术有限公司 移动用户位置预测方法及设备
CN104732756A (zh) * 2013-12-24 2015-06-24 中兴通讯股份有限公司 一种利用移动通信数据挖掘进行公交规划的方法
CN105718460A (zh) * 2014-12-02 2016-06-29 北京四维图新科技股份有限公司 一种基于历史定位信息的数据挖掘方法及装置
CN105847600A (zh) * 2015-01-12 2016-08-10 中国移动通信集团福建有限公司 一种外呼优化方法、装置及系统
CN105989226A (zh) * 2015-02-12 2016-10-05 中兴通讯股份有限公司 一种分析用户轨迹的方法及装置
CN104931041B (zh) * 2015-05-03 2017-12-01 西北工业大学 一种基于用户轨迹数据的地点序列预测方法
CN106303945A (zh) * 2015-06-01 2017-01-04 中兴通讯股份有限公司 基于wlan的终端定位方法和装置
CN105160871B (zh) * 2015-06-15 2017-10-24 北京拓明科技有限公司 一种高速公路客车临时上下人识别的方法
CN105451173A (zh) * 2015-11-04 2016-03-30 南京大学 一种基于轨迹数据分析技术的集群通信资源智能配置方法与系统
CN106920389B (zh) * 2015-12-28 2020-03-27 北京亿阳信通科技有限公司 一种基于用户电信行为的交通状况控制方法及系统
CN105682023B (zh) * 2015-12-31 2018-12-04 广州杰赛科技股份有限公司 一种用户聚集热点区域识别方法及装置
CN106383585B (zh) * 2016-09-30 2019-05-07 山东瀚岳智能科技股份有限公司 基于可穿戴设备的用户情绪识别方法及系统
CN108326875B (zh) * 2017-01-20 2023-03-24 松下知识产权经营株式会社 通信控制方法与装置、远程呈现机器人以及存储介质
CN108984561B (zh) * 2017-06-01 2021-06-22 华为技术有限公司 选址方法及设备
CN107451233B (zh) * 2017-07-25 2020-02-18 南京师范大学 时间属性优先的时空轨迹数据文件在辅助存储设备中的存储方法
CN107609196A (zh) * 2017-10-19 2018-01-19 北京工业大学 一种基于用户话单大数据特征信息的AdaBoost用户居住地判别方法
CN107995590B (zh) * 2017-11-30 2020-04-28 维沃移动通信有限公司 一种信息记录方法和移动终端
CN110737690A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 用户标签挖掘方法、装置、计算机设备和存储介质
CN109766956B (zh) * 2018-07-19 2022-08-23 西北工业大学 基于快递大数据的异常检测方法
CN109672715A (zh) * 2018-09-13 2019-04-23 深圳壹账通智能科技有限公司 用户常驻地判断方法、装置、设备及计算机可读存储介质
CN111314851B (zh) * 2018-12-12 2021-08-24 中国移动通信集团北京有限公司 一种识别一人多号的方法及装置
CN112997533B (zh) * 2018-12-27 2023-05-16 深圳市欢太科技有限公司 小区重选的处理方法、装置、移动终端及存储介质
CN110096984A (zh) * 2019-04-22 2019-08-06 重庆新境域科技有限公司 用于多空间的人员行为习惯识别及管理系统
CN110210250A (zh) * 2019-06-17 2019-09-06 国家计算机网络与信息安全管理中心 一种基于区块链的移动终端位置轨迹监测系统及方法
CN110516017B (zh) * 2019-08-02 2022-05-20 Oppo广东移动通信有限公司 基于终端设备的地点信息处理方法、装置、电子设备及存储介质
CN113032236B (zh) * 2021-04-01 2021-12-21 农夫铺子发展集团有限公司 应用于人工智能和云计算的业务行为处理方法及服务器
CN115460548A (zh) * 2022-09-05 2022-12-09 王树鹏 违规使用手机识别方法、装置、介质和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101547506A (zh) * 2009-02-17 2009-09-30 华中科技大学 基于信号接收强度信息指纹的gsm网络定位用户方法
CN101945400A (zh) * 2009-07-10 2011-01-12 中国移动通信集团公司 一种用户动态行为分析方法及分析装置
KR20110017471A (ko) * 2009-08-14 2011-02-22 김정호 사용자 위치정보를 이용한 현실공간이 복제된 3차원 가상 공간 기반의 가상세계 서비스 제공 방법 및 시스템
CN102075850A (zh) * 2009-11-19 2011-05-25 中国移动通信集团吉林有限公司 确定移动用户职业信息的方法及其装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101547506A (zh) * 2009-02-17 2009-09-30 华中科技大学 基于信号接收强度信息指纹的gsm网络定位用户方法
CN101945400A (zh) * 2009-07-10 2011-01-12 中国移动通信集团公司 一种用户动态行为分析方法及分析装置
KR20110017471A (ko) * 2009-08-14 2011-02-22 김정호 사용자 위치정보를 이용한 현실공간이 복제된 3차원 가상 공간 기반의 가상세계 서비스 제공 방법 및 시스템
CN102075850A (zh) * 2009-11-19 2011-05-25 中国移动通信集团吉林有限公司 确定移动用户职业信息的方法及其装置

Also Published As

Publication number Publication date
CN103052022A (zh) 2013-04-17

Similar Documents

Publication Publication Date Title
CN103052022B (zh) 基于移动行为的用户稳定点发现方法和系统
Frias-Martinez et al. Estimation of urban commuting patterns using cellphone network data
CN106254142A (zh) 一种基于移动通信运营数据的城市群体行为监测系统
CN111464950B (zh) 一种使用手机信令数据提取出行停驻点的方法
CN101442762B (zh) 网络性能分析以及网络故障定位方法和装置
CN102281498A (zh) 手机通话数据中用户通勤od的挖掘方法
CN111209261B (zh) 基于信令大数据的用户出行轨迹提取方法和系统
CN113239198B (zh) 一种地铁客流预测方法、装置及计算机存储介质
CN112001829B (zh) 一种基于手机信令数据的人口分布判断方法
CN101394645A (zh) 一种目标区域移动通信终端用户的流量统计方法及系统
CN102890860B (zh) 一种交通小区划分方法及装置
CN109885636B (zh) 一种用户画像方法和服务器
CN105491529A (zh) 移动终端位置数据的内存映射处理方法及大数据平台
CN101938814A (zh) 移动终端寻呼方法和移动呼叫中心设备
CN114390458B (zh) 一种应用手机信令数据辨识个体地铁乘候车行为的方法
CN111294742A (zh) 基于信令cdr数据识别伴随手机号码的方法与系统
CN108961762A (zh) 一种基于多因素融合的城市道路交通流量预测方法
CN110598917A (zh) 一种基于路径轨迹的目的地预测方法、系统及存储介质
Jacques Mobile phone metadata for development
CN112312303B (zh) 一种基于时空特性的手机信令数据精细化预处理方法
CN104967750A (zh) 筛选通话记录中陌生呼叫号码的方法及移动终端
Klimek et al. Towards a better understanding and behavior recognition of inhabitants in smart cities. A public transport case
CN105205605B (zh) 一种城市智能门户终端与电力营销终端的交互服务系统
CN101466117B (zh) 移动用户轨迹生成方法及装置
Sho Urban centre revival and the changing locations of condominiums

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant