CN114461932B - 一种用户行为特异性捕捉方法、系统及可读存储介质 - Google Patents
一种用户行为特异性捕捉方法、系统及可读存储介质 Download PDFInfo
- Publication number
- CN114461932B CN114461932B CN202111600496.2A CN202111600496A CN114461932B CN 114461932 B CN114461932 B CN 114461932B CN 202111600496 A CN202111600496 A CN 202111600496A CN 114461932 B CN114461932 B CN 114461932B
- Authority
- CN
- China
- Prior art keywords
- mobile terminal
- data
- mobile
- determining
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/029—Location-based management or tracking services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Probability & Statistics with Applications (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
本申请实施例提一种用户行为特异性捕捉方法、系统及可读存储介质,该方法包括针对各个待识别的目标移动号码,确定相应目标移动号码对应所属移动终端的目标移动数据;根据所述目标移动数据,确定各个移动终端分别对应的活动范围;对所得的各项活动范围进行叠加重合分析,得到相应的分析结果;基于得到的分析结果,进行用户行为特异性捕捉。采用本方法能够提高用户行为特异性的识别准确率。
Description
技术领域
本申请涉及通信技术领域,具体而言,涉及一种用户行为特异性捕捉方法、系统及可读存储介质。
背景技术
随着移动电话的普及,越来越多的用户拥有多个移动号码,这种情况被称为一人多卡,相应的,这样的用户就是一人多卡用户。相应的号码管理人员,在服务或维系用户关系时,往往由于无法识别一人多卡这一情况,可能会反复联系使用多个移动号码的用户。由此,不可避免的会引起用户的反感。
现有技术中已通过基于用户的身份证信息、交往圈以及位置信息,实现对一人多卡用户的识别,虽然该技术克服了上述的问题,但是由于位置信息的可变性较强,其并没有提出如何在位置信息变化的同时,对多卡用户的识别结果进行同步变更,因此其仍然存在识别准确率不高的问题。
发明内容
本申请实施例的目的在基于提供一种用户行为特异性捕捉方法、系统及可读存储介质,可以提高识别准确率。
本申请实施例还提供了一种用户行为特异性捕捉方法,包括以下步骤:
针对各个待识别的目标移动号码,确定相应目标移动号码对应所属移动终端的目标移动数据;
根据所述目标移动数据,确定各个移动终端分别对应的活动范围;
对所得的各项活动范围进行叠加重合分析,得到相应的分析结果;
基于得到的分析结果,进行用户行为特异性捕捉。
在一个实施例中,所述目标移动数据包括在预设时间段内,所述移动终端所在的基站扇区位置、基站标识以及进出扇区的时间信息中的至少一种。
在一个实施例中,所述确定相应目标移动号码对应所属移动终端的目标移动数据,包括:获取相应目标移动号码对应所属移动终端的初始移动数据;针对所述初始移动数据,当确定存在缺失数据时,进行插值补偿;所述缺失数据包括移动终端进入扇区的第一时间点、移动用户离开扇区的第二时间点、以及所处的基站扇区的位置信息;当确定插值成功时,根据插值得到的数据,确定相应的目标移动数据;当确定插值失败时,重新进行对应初始移动数据的获取。
在一个实施例中,所述根据所述目标移动数据,确定各个移动终端分别对应的活动范围,包括:针对各个移动终端,分别根据所述目标移动数据,确定在预设时间范围内,相应移动终端所在基站扇区的位置变化情况;对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果;分别基于相应的分析结果,在确定相应移动终端处于静置状态时,确定对应的第一地理位置信息,以及,在确定相应移动终端处于活动状态时,确定在不同活动时间点所对应的第二地理位置信息;综合所述第一地理位置信息和/或各项第二地理位置信息,确定各个移动终端分别对应的活动范围。
在一个实施例中,所述对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果,包括:聚类分析的过程中,根据移动终端在不同时间戳所对应的移动位置信息,确定对应的疑似移动区域和疑似固定区域;对在历史预设天数内,所属同一移动终端的疑似移动区域的生成次数进行叠加,得到相应的第一总生成次数;对在历史预设天数内,所属同一移动终端的疑似固定区域的生成次数进行叠加,得到相应的第二总生成次数;当确定所述第一总生成次数与所述第二总生成次数之间的差值大于或等于预设的差值阈值时,得到表征相应移动终端处于活动状态的分析结果;当确定所述第一总生成次数与所述第二总生成次数之间的差值小于预设的差值阈值时,得到表征相应移动终端处于静置状态的分析结果。
在一个实施例中,所述基于得到的分析结果,进行用户行为特异性捕捉之后,所述方法还包括:
将捕捉到的用户行为特异性结果传输到预设的显示终端;所述用户行为特异性结果包括表征持有相应目标移动号码的用户属于多卡用户的第一结果,以及表征持有相应目标移动号码的用户不属于多卡用户的第二结果;
由所述显示终端按照接收到的时间顺序,将接收到的各项用户行为特异性结果,依次显示在相应的屏幕位置处;
在显示各项用户行为特异性结果时,由所述显示终端获取第一结果的第一字体显示颜色,并将接收到的第二结果按照不同于所述第一字体显示颜色的第二字体显示颜色进行显示。
第二方面,本申请实施例还提供了一种用户行为特异性捕捉系统,所述系统包括第一处理模块、第二处理模块、重合分析模块和去重模块,其中:
第一处理模块,用于针对各个待识别的目标移动号码,确定相应目标移动号码对应所属移动终端的目标移动数据;
第二处理模块,用于根据所述目标移动数据,确定各个移动终端分别对应的活动范围;
重合分析模块,用于对所得的各项活动范围进行叠加重合分析,得到相应的分析结果;
去重模块,用于基于得到的分析结果,进行用户行为特异性捕捉。
在一个实施例中,所述第一处理模块还用于获取相应目标移动号码对应所属移动终端的初始移动数据;针对所述初始移动数据,当确定存在缺失数据时,进行插值补偿;所述缺失数据包括移动终端进入扇区的第一时间点、移动用户离开扇区的第二时间点、以及所处的基站扇区的位置信息;当确定插值成功时,根据插值得到的数据,确定相应的目标移动数据;当确定插值失败时,重新进行对应初始移动数据的获取。
在一个实施例中,所述第二处理模块还用于针对各个移动终端,分别根据所述目标移动数据,确定在预设时间范围内,相应移动终端所在基站扇区的位置变化情况;对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果;分别基于相应的分析结果,在确定相应移动终端处于静置状态时,确定对应的第一地理位置信息,以及,在确定相应移动终端处于活动状态时,确定在不同活动时间点所对应的第二地理位置信息;综合所述第一地理位置信息和/或各项第二地理位置信息,确定各个移动终端分别对应的活动范围。
第三方面,本申请实施例还提供了一种可读存储介质,所述可读存储介质中包括用户行为特异性捕捉方法程序,所述用户行为特异性捕捉方法程序被处理器执行时,实现如上述任一项所述的一种用户行为特异性捕捉方法的步骤。
由上可知,本申请实施例提供的一种用户行为特异性捕捉方法、系统及可读存储介质,通过确定各个目标移动号码对应所属移动终端的目标移动数据,并基于该目标移动数据确定各个移动终端分别对应的活动范围,由于用户的移动数据与活动范围相关联,如此能够提高活动范围的定位准确度。之后,再基于活动范围的叠加重合分析结果,由于针对持有多卡的用户,在一定程度上,其活动范围是同步进行变更的,相对的其活动范围的重合率也相对较高,如此便能够有效的进行用户行为特异性的捕捉,提高用户行为特异性的识别准确率。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的用户行为特异性捕捉方法的一种流程图。
图2为本申请实施例提供的用户行为特异性捕捉系统的一种结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本申请一些实施例中的一种用户行为特异性捕捉方法的流程图。以该方法应用于计算机设备(该计算机设备具体可以是终端或服务器,终端具体可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群)为例进行说明,包括以下步骤:
步骤S100,针对各个待识别的目标移动号码,确定相应目标移动号码对应所属移动终端的目标移动数据。
具体的,目标移动数据包括在预设时间段内,移动终端所在的基站扇区位置、基站标识以及进出扇区的时间信息中的至少一种。
需要说明的是,(1)基站一般可设在小区的中心,用全向天线形成圆形的覆盖区,这就是“中心激励”方式。当然,也可将基站设在每个小区六边形的三个顶点上,每个基站采用三副120度扇形辐射的定向天线,分别覆盖三个相邻小区的各三分之一的区域,每个小区由三副120度扇形天线共同覆盖,这就是“顶点激励”方式,而每副天线覆盖的区域就是一个基站扇区。因此,当前实施例中的基站扇区位置即为天线覆盖的区域位置。(2)基站标识可以进一步理解为基站编号,通常情况下,通过基站编号就可以得知手机所在的位置。
在其中一个实施例中,计算机设备利用电信运营商的信令数据,对一个时间段内、且一个用户群中,每个待识别的目标移动号码所在的基站扇区位置、基站标识、以及进出扇区的时间信息进行采集。在一个实施例中,计算机设备在利用采集的数据进行用户行为特异性捕捉之前,也可以对采集的数据进行数据去重,以从采集的数据中过滤重复信息。或,进行数据格式转换,以保证采集数据的数据格式一致性。
步骤S200,根据目标移动数据,确定各个移动终端分别对应的活动范围。
具体的,计算机设备首先根据各个移动终端在不同时间戳的移动位置,来判断移动终端是处于移动状态还是静置状态,之后,再根据由此判断出的移动区域和固定区域,来确定对应的活动范围。需要说明的是,这里所说的移动区域和固定区域均为初步判断得到的疑似区域,后续将基于移动终端在过去多天内的活动区域,对疑似区域进行再次判断,以提高区域识别准确度。
步骤S300,对所得的各项活动范围进行叠加重合分析,得到相应的分析结果。
具体的,计算机设备基于得到的各项活动范围,将计算各项活动范围分别对应的重合率。在一个实施例中,例如,各项活动范围构成的集合为:{A,B,B,A,C,D,A,B,D,D},基于该集合,在确定活动范围A出现的总次数为3,集合中包括的活动范围总数量为10时,则活动范围A的重合率可以基于公式:“3/10”(即由“活动范围A出现的总次数”除以“活动范围总数量”)所确定。之后,计算机设备在确定相应活动范围的重合率大于预设的重合率阈值、且对应移动终端之间不存在通信或通信次数小于一定值(该值可以根据实际情况,灵活调整)时,得到持有相应目标移动号码用户对应的是多卡用户的第一分析结果。反之,则得到持有相应目标移动号码的用户不属于多卡用户的第二分析结果。
步骤S400,基于得到的分析结果,进行用户行为特异性捕捉。
具体的,当前所需要捕捉的用户行为特异性包括持多卡用户(即一个手机用户同时携带多个手机号码)的识别。之所以需要进行多卡用户的识别,是为了在采用移动通信大数据对人口数量进行监测和统计时,避免一机多卡现象的问题,影响数据统计的准确性和可靠性。或者,运营客服在服务和维系移动用户时,由于没有提前认识到一人多卡这一问题,导致频繁的与同一用户进行通话,避免随之导致的用户反感问题,提高了用户的服务满意度。
上述用户行为特异性捕捉方法,通过确定各个目标移动号码对应所属移动终端的目标移动数据,并基于该目标移动数据确定各个移动终端分别对应的活动范围,由于用户的移动数据与活动范围相关联,如此能够提高活动范围的定位准确度。之后,再基于活动范围的叠加重合分析结果,由于针对持有多卡的用户,在一定程度上,其活动范围是同步进行变更的,相对的其活动范围的重合率也相对较高,如此便能够有效的进行用户行为特异性的捕捉,提高用户行为特异性的识别准确率。
在一个实施例中,步骤S100中,确定相应目标移动号码对应所属移动终端的目标移动数据,包括:
步骤S101,获取相应目标移动号码对应所属移动终端的初始移动数据。
具体的,由于前一实施例中,已对目标移动数据的数据类型进行了具体说明,本申请实施例在此不做过多说明。在一个实施例中,计算机设备可以通过电信运营商的信令数据,进行初始移动数据的获取。
需要说明的是,上述电信运营商的信令数据是由移动终端用户在发生通话、发短信或移动位置等事件时,被运营商的通信基站捕获并记录同一用户信令轨迹所产生的,之后,经过脱密、脱敏(例如过滤用户的私密身份信息)、扩样等处理后,可以用来分析用户的行为偏好、以及移动轨迹等。其中,信令数据字段中除了包括事件属性、空间位置属性,还包括了通话和信息记录等信息。而,这些信息都能够很好的帮助计算机设备对各个移动终端的活动范围进行有效识别。
步骤S102,针对初始移动数据,当确定存在缺失数据时,进行插值补偿;缺失数据包括移动终端进入扇区的第一时间点、移动用户离开扇区的第二时间点、以及所处的基站扇区的位置信息。
具体的,为保证数据完整性,计算机设备在确定存在缺失数据时,例如,在用户进入扇区A的时间点,以及,进入扇区B的时间点之间,没有用户离开扇区A的时间点,当前情况将认为存在缺失数据,需要插补用户离开扇区A的时间点。
具体在实施的时候,初始移动数据可以预先存储在数据库中,在确定第一时间点、或第二时间点是否缺失时,计算机设备从数据库中,按照时间顺序依次获取相应的数据,并根据所取数据之间的关联性进行缺失数据的判断。以及,在判断基站扇区的位置信息是否缺失时,可以将获取到的位置信息与预设的正则表达式进行匹配,当确定匹配成功时,则认为不存在缺失数据;反之,则基于当前获取到的位置信息,进行缺失字段的判断,以及,后续还会进行缺失字段的获取、以及插补。
在一个实施例中,计算机设备在进行缺失字段的插补时,可以将缺失变量划分为数值型、以及非数值型分别进行处理。例如,针对数值型的缺失变量,计算机设备需要获取该缺失变量在其他所有对象中的取值;之后,计算机设备再基于该取值的平均值,来填充该缺失的变量值(其可以进一步理解为通过过往的经验,进一步确定缺失的变量值)。又例如,针对非数值型的缺失变量,计算机设备依然还是需要获取该缺失变量在其他所有对象中的取值,并统计对应的取值次数;之后,计算机设备再基于取值次数最多的值进行缺失变量的填充。
当然,当前实施例中,计算机设备还也可以基于缺失变量A设定查询条件,并基于该查询条件向数据库请求进行相似对象B的获取(即从数据库中找出与缺失变量A最为相似的一个数据对象,这里的相似可以理解为取值上的近似,以及描述语言上的近似等,本申请实施例对此不做过多说明),后续,计算机设备再基于当前查找到的对象进行填补等,本申请实施例对此不做限定。
步骤S103,当确定插值成功时,根据插值得到的数据,确定相应的目标移动数据。
具体的,计算机设备在确定插值成功时,将把当前插值得到的数据作为目标移动数据,后续将基于该目标移动数据对相应移动终端的活动范围进行识别。
步骤S104,当确定插值失败时,重新进行对应初始移动数据的获取。
具体的,计算机设备在确定插值失败时,可以重复多次插值操作,例如,重复执行步骤S102多次,若均确定插值失败时(基于上述的实施例,插值失败的原因可以有很多个,例如数据库中预先没有存储对应的数据对象,或,其他所有对象中的取值获取失败),则返回到步骤S101,重新进行对应初始移动数据的获取。在一个实施例中,计算机设备也可以在首次插值失败时,直接返回到步骤S101中,进行初始移动数据的获取,本申请实施例对此不做限定。
上述实施例中,通过插值将缺失数据填充到初始移动数据中,确保了移动数据的完整性,避免由于不完整的移动数据导致对各个移动终端分别对应的活动范围识别错误,提高了识别准确度。
在一个实施例中,步骤S200中,根据目标移动数据,确定各个移动终端分别对应的活动范围,包括:
步骤S201,针对各个移动终端,分别根据目标移动数据,确定在预设时间范围内,相应移动终端所在基站扇区的位置变化情况。
步骤S202,对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果。
具体的,计算机设备将所属同一移动终端的多项位置变化情况集合到相应的聚类集合中,该聚类集合可以进一步理解为其是一个轨迹点集合。基于该轨迹点集合可以进一步反映对应移动终端在某一天中的移动轨迹。在一个实施例中,计算机设备可以使用基于密度的聚类算法进行聚类分析,该算法在使用的过程中,主要是通过设置聚类最小点数以及点数之间的距离阈值进行聚类。
步骤S203,分别基于相应的分析结果,在确定相应移动终端处于静置状态时,确定对应的第一地理位置信息,以及,在确定相应移动终端处于活动状态时,确定在不同活动时间点所对应的第二地理位置信息。
具体的,计算机设备基于得到的分析结果,在确定相应移动终端长时间在某一固定区域,即相应移动终端所在的基站扇区位置持续固定不变、且其所处的地理位置,则认为其处于静置状态,此时,计算机设备会将相应移动终端当下所处的地理位置作为第一地理位置信息。反之,若相应移动终端所在的基站扇区位置持续处于变化的状态、且其所处的地理位置也一直在发生改变,则将相应移动终端在各个移动时间点分别所处的不同地理位置,作为第二地理位置信息。
步骤S204,综合第一地理位置信息和/或各项第二地理位置信息,确定各个移动终端分别对应的活动范围。
具体的,计算机设备将得到的第一地理位置信息,和/或,各项第二地理位置信息存储到一个统一的集合中,并基于各项地理位置信息在地理位置上的关联性,确定各个移动终端分别对应的活动范围。例如,在确定相应移动终端在不同时刻所处的地理位置信息均属于A街道时,则确定该移动终端的活动范围为A街道。
上述实施例中,通过对所属同一移动终端的多项位置变化情况进行聚类分析,通过有效的分析出相应移动终端的移动轨迹,进一步确定各个移动终端分别对应的活动范围,如此将有效提高用户行为特异性的识别准确率。
在一个实施例中,步骤S202中,对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果,包括:
步骤S2021,聚类分析的过程中,根据移动终端在不同时间戳所对应的移动位置信息,确定对应的疑似移动区域和疑似固定区域。
步骤S2022,对在历史预设天数内,所属同一移动终端的疑似移动区域的生成次数进行叠加,得到相应的第一总生成次数。
具体的,计算机设备基于过去多天内,叠加计算得到所属同一移动终端的疑似移动区域的总生成次数。例如,可以以天为单位,将所属同一天的疑似移动区域统计在一个列表中,之后,再对在历史预设天数内生成的各项列表进行遍历,并对该疑似移动区域的遍历次数进行记录,当遍历结束时,对所属同一移动终端的疑似移动区域的遍历次数进行叠加,将得到相应的第一总生成次数。
步骤S2023,对在历史预设天数内,所属同一移动终端的疑似固定区域的生成次数进行叠加,得到相应的第二总生成次数。
具体的,该步骤与步骤S2022本质是一致的,因此,该步骤的实施方式可以参考上述实施例,本申请实施例不做过多说明。
步骤S2024,当确定第一总生成次数与第二总生成次数之间的差值大于或等于预设的差值阈值时,得到表征相应移动终端处于活动状态的分析结果。
步骤S2025,当确定第一总生成次数与第二总生成次数之间的差值小于预设的差值阈值时,得到表征相应移动终端处于静置状态的分析结果。
在一个实施例中,基于得到的分析结果,进行用户行为特异性捕捉之后,该方法还包括:
步骤S500,将捕捉到的用户行为特异性结果传输到预设的显示终端;用户行为特异性结果包括表征持有相应目标移动号码的用户属于多卡用户的第一结果,以及表征持有相应目标移动号码的用户不属于多卡用户的第二结果。
具体的,计算机设备在确定成功连接到显示终端时,会把捕捉到的用户行为特异性结果传输到该显示终端,由该显示终端进行实时显示。需要说明的是,用户行为特异性结果即为一人多卡的识别结果。当前实施例中,主要针对的是单用户单独行动这一应用场景,计算机设备主要是基于不同移动号码,对应的移动终端之间活动范围的重合率进行的判断,为了保证识别准确度,针对重合率高的移动号码A和移动号码B,可以再进一步验证两者之间的通话频次,若几乎都没有通话记录或通话记录的次数较少(可以理解为通话记录次数小于预设的次数阈值),则可以进一步认为移动号码A和移动号码B为同一用户所持有。
步骤S600,由显示终端按照接收到的时间顺序,将接收到的各项用户行为特异性结果,依次显示在相应的屏幕位置处。
具体的,在进行特异性结果显示的时候,显示终端可以按照时间顺序在显示屏幕中,从上到下的依次进行排列显示,例如,对于接收时间晚于结果A的结果B,结果A的显示位置将位于结果B的上方,对于接收时间晚于结果B的结果C,结果B的显示位置将位于结果C的上方,如此即按照A、B、C...的顺序依次显示在显示屏幕。在一个实施例中,计算机设备还能够基于重点用户以及非重点用户的区分,将对应重点用户的用户行为特异性结果显示在屏幕中醒目的位置处(例如,屏幕的正中间),又或者,计算机设备还可以将对应重点用户的用户行为特异性结果的显示颜色进行调整,例如,将原先的黑色调整为红色、黄色等,通过颜色加以区分。
步骤S700,在显示各项用户行为特异性结果时,由显示终端获取第一结果的第一字体显示颜色,并将接收到的第二结果按照不同于第一字体显示颜色的第二字体显示颜色进行显示。
具体的,计算机设备按照不同的字体显示颜色,分别对第一结果、以及第二结果进行显示,如此,能够帮助观察者及时定位到所需要的信息,避免由于同一字体颜色,所导致的信息混淆。
上述实施例中,将得到的用户行为特异性结果实时显示在预设的显示终端,能够帮助相应的处理人员及时掌握行为特异性捕捉情况,避免影响数据统计的准确性和可靠性,以及避免由于一人多卡所导致的用户反感问题。
请参照图2所示,本申请实施例还提供了一种用户行为特异性捕捉系统200,该系统200包括第一处理模块201、第二处理模块202、重合分析模块203和去重模块204,其中:
第一处理模块201,用于针对各个待识别的目标移动号码,确定相应目标移动号码对应所属移动终端的目标移动数据。
第二处理模块202,用于根据目标移动数据,确定各个移动终端分别对应的活动范围。
重合分析模块203,用于对所得的各项活动范围进行叠加重合分析,得到相应的分析结果。
去重模块204,用于基于得到的分析结果,进行用户行为特异性捕捉。
在其中一个实施例中,第一处理模块201还用于获取相应目标移动号码对应所属移动终端的初始移动数据;针对初始移动数据,当确定存在缺失数据时,进行插值补偿;缺失数据包括移动终端进入扇区的第一时间点、移动用户离开扇区的第二时间点、以及所处的基站扇区的位置信息;当确定插值成功时,根据插值得到的数据,确定相应的目标移动数据;当确定插值失败时,重新进行对应初始移动数据的获取。
在其中一个实施例中,第二处理模块202还用于针对各个移动终端,分别根据目标移动数据,确定在预设时间范围内,相应移动终端所在基站扇区的位置变化情况;对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果;分别基于相应的分析结果,在确定相应移动终端处于静置状态时,确定对应的第一地理位置信息,以及,在确定相应移动终端处于活动状态时,确定在不同活动时间点所对应的第二地理位置信息;综合第一地理位置信息和/或各项第二地理位置信息,确定各个移动终端分别对应的活动范围。
在其中一个实施例中,重合分析模块203还用于聚类分析的过程中,根据移动终端在不同时间戳所对应的移动位置信息,确定对应的疑似移动区域和疑似固定区域;对在历史预设天数内,所属同一移动终端的疑似移动区域的生成次数进行叠加,得到相应的第一总生成次数;对在历史预设天数内,所属同一移动终端的疑似固定区域的生成次数进行叠加,得到相应的第二总生成次数;当确定第一总生成次数与第二总生成次数之间的差值大于或等于预设的差值阈值时,得到表征相应移动终端处于活动状态的分析结果;当确定第一总生成次数与第二总生成次数之间的差值小于预设的差值阈值时,得到表征相应移动终端处于静置状态的分析结果。
在其中一个实施例中,该系统200还包括显示模块,其中:
显示模块,用于将捕捉到的用户行为特异性结果传输到预设的显示终端;用户行为特异性结果包括表征持有相应目标移动号码的用户属于多卡用户的第一结果,以及表征持有相应目标移动号码的用户不属于多卡用户的第二结果;由显示终端按照接收到的时间顺序,将接收到的各项用户行为特异性结果,依次显示在相应的屏幕位置处;在显示各项用户行为特异性结果时,由显示终端获取第一结果的第一字体显示颜色,并将接收到的第二结果按照不同于第一字体显示颜色的第二字体显示颜色进行显示。
由上可知,本申请实施例提供的用户行为特异性捕捉系统,通过确定各个目标移动号码对应所属移动终端的目标移动数据,并基于该目标移动数据确定各个移动终端分别对应的活动范围,由于用户的移动数据与活动范围相关联,如此能够提高活动范围的定位准确度。之后,再基于活动范围的叠加重合分析结果,由于针对持有多卡的用户,在一定程度上,其活动范围应该是同步进行变更的,相对的其活动范围的重合率也相对较高,如此便能够有效的进行用户行为特异性的捕捉,提高用户行为特异性的识别准确率。
本申请实施例提供一种存储介质,所述计算机程序被处理器执行时,执行上述实施例的任一可选的实现方式中的方法。其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random AccessMemory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable ProgrammableRead-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable ProgrammableRead Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (5)
1.一种用户行为特异性捕捉方法,其特征在于,包括以下步骤:
针对各个待识别的目标移动号码,确定相应目标移动号码对应所属移动终端的目标移动数据;
根据所述目标移动数据,确定各个移动终端分别对应的活动范围;
对所得的各项活动范围进行叠加重合分析,得到相应的分析结果;
基于得到的分析结果,进行用户行为特异性捕捉;
所述确定相应目标移动号码对应所属移动终端的目标移动数据,包括:
获取相应目标移动号码对应所属移动终端的初始移动数据;
针对所述初始移动数据,当确定存在缺失数据时,进行插值补偿;所述缺失数据包括移动终端进入扇区的第一时间点、移动用户离开扇区的第二时间点、以及所处的基站扇区的位置信息;
当确定插值成功时,根据插值得到的数据,确定相应的目标移动数据;
当确定插值失败时,重新进行对应初始移动数据的获取;
存在缺失数据时初始移动数据预先存储在数据库中,在确定第一时间点或第二时间点缺失时计算机设备从数据库中按照时间顺序依次获取相应的数据并根据数据之间的关联性进行缺失数据判断;
若判断基站扇区的位置信息缺失时将获取到的位置信息与预设的正则表达式进行匹配;
若匹配成功则认为不存在缺失数据,反之则基于当前获取到的位置信息进行缺失字段的判断,以及缺失字段的获取和插补;
所述根据所述目标移动数据,确定各个移动终端分别对应的活动范围,包括:
针对各个移动终端,分别根据所述目标移动数据,确定在预设时间范围内,相应移动终端所在基站扇区的位置变化情况;
对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果;
分别基于相应的分析结果,在确定相应移动终端处于静置状态时,确定对应的第一地理位置信息,以及,在确定相应移动终端处于活动状态时,确定在不同活动时间点所对应的第二地理位置信息;
综合所述第一地理位置信息和/或各项第二地理位置信息,确定各个移动终端分别对应的活动范围;
所述对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果,包括:
聚类分析的过程中,根据移动终端在不同时间戳所对应的移动位置信息,确定对应的疑似移动区域和疑似固定区域;
对在历史预设天数内,所属同一移动终端的疑似移动区域的生成次数进行叠加,得到相应的第一总生成次数;
对在历史预设天数内,所属同一移动终端的疑似固定区域的生成次数进行叠加,得到相应的第二总生成次数;
当确定所述第一总生成次数与所述第二总生成次数之间的差值大于或等于预设的差值阈值时,得到表征相应移动终端处于活动状态的分析结果;
当确定所述第一总生成次数与所述第二总生成次数之间的差值小于预设的差值阈值时,得到表征相应移动终端处于静置状态的分析结果。
2.根据权利要求1所述的方法,其特征在于,所述目标移动数据包括在预设时间段内,所述移动终端所在的基站扇区位置、基站标识以及进出扇区的时间信息中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述基于得到的分析结果,进行用户行为特异性捕捉之后,所述方法还包括:
将捕捉到的用户行为特异性结果传输到预设的显示终端;所述用户行为特异性结果包括表征持有相应目标移动号码的用户属于多卡用户的第一结果,以及表征持有相应目标移动号码的用户不属于多卡用户的第二结果;
由所述显示终端按照接收到的时间顺序,将接收到的各项用户行为特异性结果,依次显示在相应的屏幕位置处;
在显示各项用户行为特异性结果时,由所述显示终端获取第一结果的第一字体显示颜色,并将接收到的第二结果按照不同于所述第一字体显示颜色的第二字体显示颜色进行显示。
4.一种用户行为特异性捕捉系统,其特征在于,所述系统包括第一处理模块、第二处理模块、重合分析模块和去重模块,其中:
第一处理模块,用于针对各个待识别的目标移动号码,确定相应目标移动号码对应所属移动终端的目标移动数据;
第二处理模块,用于根据所述目标移动数据,确定各个移动终端分别对应的活动范围;
重合分析模块,用于对所得的各项活动范围进行叠加重合分析,得到相应的分析结果;
去重模块,用于基于得到的分析结果,进行用户行为特异性捕捉;
所述确定相应目标移动号码对应所属移动终端的目标移动数据,包括:
获取相应目标移动号码对应所属移动终端的初始移动数据;
针对所述初始移动数据,当确定存在缺失数据时,进行插值补偿;所述缺失数据包括移动终端进入扇区的第一时间点、移动用户离开扇区的第二时间点、以及所处的基站扇区的位置信息;
当确定插值成功时,根据插值得到的数据,确定相应的目标移动数据;
当确定插值失败时,重新进行对应初始移动数据的获取;
存在缺失数据时初始移动数据预先存储在数据库中,在确定第一时间点或第二时间点缺失时计算机设备从数据库中按照时间顺序依次获取相应的数据并根据数据之间的关联性进行缺失数据判断;
若判断基站扇区的位置信息缺失时将获取到的位置信息与预设的正则表达式进行匹配;
若匹配成功则认为不存在缺失数据,反之则基于当前获取到的位置信息进行缺失字段的判断,以及缺失字段的获取和插补;
所述根据所述目标移动数据,确定各个移动终端分别对应的活动范围,包括:
针对各个移动终端,分别根据所述目标移动数据,确定在预设时间范围内,相应移动终端所在基站扇区的位置变化情况;
对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果;
分别基于相应的分析结果,在确定相应移动终端处于静置状态时,确定对应的第一地理位置信息,以及,在确定相应移动终端处于活动状态时,确定在不同活动时间点所对应的第二地理位置信息;
综合所述第一地理位置信息和/或各项第二地理位置信息,确定各个移动终端分别对应的活动范围;
所述对所属同一移动终端的多项位置变化情况进行聚类分析,得到相应的分析结果,包括:
聚类分析的过程中,根据移动终端在不同时间戳所对应的移动位置信息,确定对应的疑似移动区域和疑似固定区域;
对在历史预设天数内,所属同一移动终端的疑似移动区域的生成次数进行叠加,得到相应的第一总生成次数;
对在历史预设天数内,所属同一移动终端的疑似固定区域的生成次数进行叠加,得到相应的第二总生成次数;
当确定所述第一总生成次数与所述第二总生成次数之间的差值大于或等于预设的差值阈值时,得到表征相应移动终端处于活动状态的分析结果;
当确定所述第一总生成次数与所述第二总生成次数之间的差值小于预设的差值阈值时,得到表征相应移动终端处于静置状态的分析结果。
5.一种可读存储介质,其特征在于,所述可读存储介质中包括用户行为特异性捕捉方法程序,所述用户行为特异性捕捉方法程序被处理器执行时,实现如权利要求1至3中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111600496.2A CN114461932B (zh) | 2021-12-24 | 2021-12-24 | 一种用户行为特异性捕捉方法、系统及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111600496.2A CN114461932B (zh) | 2021-12-24 | 2021-12-24 | 一种用户行为特异性捕捉方法、系统及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114461932A CN114461932A (zh) | 2022-05-10 |
CN114461932B true CN114461932B (zh) | 2022-10-11 |
Family
ID=81406961
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111600496.2A Active CN114461932B (zh) | 2021-12-24 | 2021-12-24 | 一种用户行为特异性捕捉方法、系统及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114461932B (zh) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8666390B2 (en) * | 2011-08-29 | 2014-03-04 | At&T Mobility Ii Llc | Ticketing mobile call failures based on geolocated event data |
CN103841550B (zh) * | 2012-11-21 | 2017-05-03 | 中国移动通信集团吉林有限公司 | 一种识别一人多卡用户的方法及装置 |
CN112866192B (zh) * | 2020-12-30 | 2022-11-04 | 绿盟科技集团股份有限公司 | 一种识别异常聚集行为的方法及装置 |
-
2021
- 2021-12-24 CN CN202111600496.2A patent/CN114461932B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114461932A (zh) | 2022-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10524093B2 (en) | User description based on contexts of location and time | |
EP3132592B1 (en) | Method and system for identifying significant locations through data obtainable from a telecommunication network | |
US20110055216A1 (en) | Tempo spatial data extraction from network connected devices | |
CN107086922B (zh) | 一种用户行为识别方法和装置 | |
CN107885742B (zh) | 服务推荐方法和装置 | |
US9179259B2 (en) | Recognizing unknown actors based on wireless behavior | |
CN110572813A (zh) | 一种基于移动大数据的手机用户行为相似度分析方法 | |
CN102075850B (zh) | 确定移动用户职业信息的方法及其装置 | |
CN111148018B (zh) | 基于通信数据识别定位区域价值的方法和装置 | |
CN104317918A (zh) | 基于复合大数据gis的异常行为分析及报警系统 | |
CN111178932A (zh) | 用户地理画像生成方法、装置、计算机设备和存储介质 | |
CN113935881A (zh) | 一种基于大数据的人口结构分析方法、系统及可读存储介质 | |
CN110610182A (zh) | 用户轨迹相似度判断方法和相关装置 | |
CN112954626A (zh) | 手机信令数据分析方法、装置、电子设备及存储介质 | |
CN114219379B (zh) | 一种适用于社区服务圈的资源配套评估方法、及系统 | |
CN111372194B (zh) | 一种手机换卡用户智能化识别方法 | |
CN114461932B (zh) | 一种用户行为特异性捕捉方法、系统及可读存储介质 | |
CN111291278B (zh) | 轨迹相似度的计算方法、装置、存储介质及终端 | |
CN100405870C (zh) | 一种采集和使用用户特征数据识别用户的系统和方法 | |
CN111242723A (zh) | 用户子女情况判断方法、服务器及计算机可读存储介质 | |
CN108513303B (zh) | 同号终端的异常监控方法和装置 | |
CN110516097A (zh) | 一种图像数据关联分析方法、装置及存储介质 | |
CN107040603B (zh) | 用于确定应用程序App活跃场景的方法和装置 | |
CN107770734B (zh) | 移动用户常驻地识别方法及装置 | |
CN113407821A (zh) | 一种小区动态内容推荐方法、系统、智能终端及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Zhang Guangzhi Inventor after: Cheng Lili Inventor after: Jia Xiaofeng Inventor after: Gao Wenfei Inventor after: Yu Xiaobo Inventor before: Zhang Guangzhi Inventor before: Cheng Lili Inventor before: Jia Xiaofeng Inventor before: Gao Wenfei Inventor before: Yu Xiaobo |
|
CB03 | Change of inventor or designer information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |