CN106658564B - 一种家庭用户的识别方法及装置 - Google Patents
一种家庭用户的识别方法及装置 Download PDFInfo
- Publication number
- CN106658564B CN106658564B CN201611024350.7A CN201611024350A CN106658564B CN 106658564 B CN106658564 B CN 106658564B CN 201611024350 A CN201611024350 A CN 201611024350A CN 106658564 B CN106658564 B CN 106658564B
- Authority
- CN
- China
- Prior art keywords
- user
- target user
- mobile subscriber
- call
- family
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5061—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the interaction between service providers and their network customers, e.g. customer relationship management
- H04L41/5064—Customer relationship management
Abstract
本发明公开了一种家庭用户的识别方法,包括:分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据;所述通话数据包括用户终端发生通话的时间和基站识别码;将所述目标用户分别与每个移动用户组成一组用户对;对每组用户对的通话数据进行检测,并在检测到所述用户对的通话数据满足预设的家庭通话规则时,将所述用户对中的移动用户作为所述目标用户的家庭候选用户;对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户。相应的,本发明还公开了一种家庭用户的识别装置。采用本发明实施例,能够快速、准确地识别家庭用户。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及一种家庭用户的识别方法及装置。
背景技术
随着移动通信的发展,家庭用户市场是近几年出现的一个新兴市场,家庭用户是对集团客户市场和个人客户市场的一个很好的补充。在网络带宽的不断升级,以及各类新兴增值业务快速发展的推动下,家庭用户已不满足于单一的语音、上网需求,对移动通信企业来说,用户的需求点转向了娱乐、生活应用类的服务需求,因此各大电信运营商陆续开始发展家庭业务,家庭用户市场蕴含着很多新的商机。但是,目前运营商仅仅关注用户的交往圈子,对于用户的家庭圈子的关注度较少,无法有效针对家庭用户推广家庭业务。
发明内容
本发明实施例提出一种家庭用户的识别方法及装置,能够快速、准确地识别家庭用户。
本发明实施例提供一种家庭用户的识别方法,包括:
分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据;所述通话数据包括用户终端发生通话的时间和基站识别码;
将所述目标用户分别与每个移动用户组成一组用户对;
对每组用户对的通话数据进行检测,并在检测到所述用户对的通话数据满足预设的家庭通话规则时,将所述用户对中的移动用户作为所述目标用户的家庭候选用户;
对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户。
进一步地,所述分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据,具体包括:
获取在预设时间段内与预设的目标用户通话的移动用户的话单;
去除所述话单为外省公司漫游话单、客服话单、公共服务性话单的移动用户;
分别提取所述目标用户和保留的每个移动用户在预设时间段内的通话数据。
进一步地,在所述将所述目标用户分别与每个移动用户组成一组用户对之前,还包括:
根据所述通话数据,分别计算每个移动用户与所述目标用户的交往指数;
去除所述交往指数低于预设交往阈值的移动用户,并将保留的移动用户添加到所述目标用户的交往圈中。
进一步地,所述根据所述通话数据,分别计算每个移动用户与所述目标用户的交往指数,具体包括:
根据所述通话数据,获取所述目标用户与每个移动用户的通话频率、通话次数和通话时长;
将所有移动用户按照通话次数的大小进行排序,并查询预设的通话次数排序得分表,获得每个移动用户所对应的通话次数得分;
将所有移动用户按照通话时长的大小进行排序,并查询预设的通话时长排序得分表,获得每个移动用户所对应的通话时长得分;
根据所述通话频率、所述通话次数得分和所述通话时长得分,采用交往指数算法,计算获得每个移动用户与所述目标用户的交往指数;
所述交往指数算法如下:
F=40*X+30*Y+30*Z;
其中,F为交往指数,X为通话频率,Y为通话次数得分,Z为通话时长得分。
进一步地,所述家庭通话规则包括以下任意一种:
用户对中的目标用户和移动用户对其交往圈的总通话占比均大于40%,且通话总时长均大于50分钟;
用户对中的目标用户和移动用户的交往圈重合率达到20%,且对其交往圈的总通话占比均大于40%;
用户对中的目标用户和移动用户对其交往圈的源呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户对其交往圈的目标呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户的闲时通话基站重合率达到30%,且与其交往圈的通话次数均大于5次;
用户对中的目标用户和移动用户与其交往圈的通话次数大于15次,且周末通话基站重合率达到30%。
进一步地,所述关联阈值包括支持度阈值和置信度阈值;
所述对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户,具体包括:
获取所述目标用户及其家庭候选用户之间的所有交往对的通话关系;
对获取的所有通话关系进行关联规则处理,获得每个交往对的支持度和置信度;
提取所述支持度满足所述支持度阈值,且置信度满足所述置信度阈值的交往对,并将提取的交往对中的家庭候选用户作为所述目标用户的家庭用户。
进一步地,所述用户关系预测方法还包括:
根据获取的所有通话关系,采用频繁模式增长算法,从所述目标用户及其家庭用户中识别出家庭户主。
相应地,本发明实施例还提供一种家庭用户的识别装置,包括:
数据提取模块,用于分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据;所述通话数据包括用户终端发生通话的时间和基站识别码;
用户对组成模块,用于将所述目标用户分别与每个移动用户组成一组用户对;
检测模块,用于对每组用户对的通话数据进行检测,并在检测到所述用户对的通话数据满足预设的家庭通话规则时,将所述用户对中的移动用户作为所述目标用户的家庭候选用户;以及,
家庭用户获取模块,用于对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户。
进一步地,所述关联阈值包括支持度阈值和置信度阈值;
所述家庭用户获取模块具体包括:
通话关系获取单元,用于获取所述目标用户及其家庭候选用户之间的所有交往对的通话关系;
数据获取单元,用于对获取的所有通话关系进行关联规则处理,获得每个交往对的支持度和置信度;以及,
家庭用户获取单元,用于提取所述支持度满足所述支持度阈值,且置信度满足所述置信度阈值的交往对,并将提取的交往对中的家庭候选用户作为所述目标用户的家庭用户。
进一步地,所述家庭用户的识别装置还包括:
户主识别模块,用于根据获取的所有通话关系,采用频繁模式增长算法,从所述目标用户及其家庭用户中识别出家庭户主。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的家庭用户的识别方法及装置,能够将目标用户分别与其通话的移动用户组成用户对,并根据其通话数据从移动用户中检测出目标用户的家庭候选用户,再结合关联规则对目标用户及其家庭候选用户之间的通话关系进行处理,以从家庭候选用户中识别出目标用户的家庭用户,实现家庭用户的快速、准确识别;采用频繁模式增长算法对目标用户及其家庭候选用户之间的通话关系进行处理,以识别出目标用户及其家庭用户所构成的家庭圈子中的户主,更有利于运营商在市场营销中抓住关键的人物。
附图说明
图1是本发明提供的家庭用户的识别方法的一个实施例的流程示意图;
图2是本发明提供的家庭用户的识别装置的一个实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,本发明提供的家庭用户的识别方法的一个实施例的流程示意图,包括:
S1、分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据;所述通话数据包括用户终端发生通话的时间和基站识别码;
S2、将所述目标用户分别与每个移动用户组成一组用户对;
S3、对每组用户对的通话数据进行检测,并在检测到所述用户对的通话数据满足预设的家庭通话规则时,将所述用户对中的移动用户作为所述目标用户的家庭候选用户;
S4、对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户。
需要说明的是,对目标用户的家庭用户进行识别需将与目标用户通话的每个移动用户分别与该目标用户进行匹配。先分别提取该目标用户及其每个移动用户的通话数据,其中,目标用户分别与每个移动用户组成一组用户对以进行检测匹配。当检测到一组用户对中的目标用户和移动用户相匹配,即其通话数据满足预设的家庭通话规则时,就保留该用户对中的移动用户,否则去除该用户对中的移动用户,其中,保留的移动用户为目标用户的家庭候选用户,即保留的移动用户有可能为目标用户的家庭用户。在筛选出家庭候选用户后,对目标用户及其家庭候选用户中的“一对一”交往对进行关联规则处理,计算每个交往对的关联值,并筛选出关联值大于预设的关联阈值的交往对,筛选出的交往对中的移动用户即为目标用户的家庭用户。本发明实施例利用运营商的移动用户动态、具有时效性的用户交往网络,采用家庭通话规则寻找出家庭候选用户,再结合关联规则的方法找到目标用户的家庭用户,而实现家庭用户的快速、准确地识别。
进一步地,所述分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据,具体包括:
获取在预设时间段内与预设的目标用户通话的移动用户的话单;
去除所述话单为外省公司漫游话单、客服话单、公共服务性话单的移动用户;
分别提取所述目标用户和保留的每个移动用户在预设时间段内的通话数据。
需要说明的是,在提取通话数据时,可对与目标用户通话的移动用户进行初步筛选,即在于目标用户通话的话单中,对外省公司用户漫游来的话单、客服话单(如10086/10000)、公共服务性话单(如以400/800/600开头的话单)进行剔除,以便目标用户的通话圈能够真正反映一个正常的通信用户的基本、规律、本地交往诉求。进而,对目标用户和保留的每个移动用户的通信数据进行提取,其中,通信数据为基于运营商的信息,这些信息很容易通过运营商获取,使得通信数据的获取便利。另外,本发明实施例考虑了用户交往网络的动态性,贴合运营商进行市场推广的特点。
进一步地,在所述将所述目标用户分别与每个移动用户组成一组用户对之前,还包括:
根据所述通话数据,分别计算每个移动用户与所述目标用户的交往指数;
去除所述交往指数低于预设交往阈值的移动用户,并将保留的移动用户添加到所述目标用户的交往圈中。
需要说明的是,在提取通信数据后,需根据通信数据对保留的移动用户进行第二次筛选,即分别计算每个移动与目标用户的交往指数,交往指数大的移动用户为目标用户的有效通信用户,从而将交往指数大于预设交往阈值的移动用户纳入目标用户的交往圈中。另外,在获取目标用户的交往圈的同时,采用相同方法获取目标用户交往圈中每个移动用户的交往圈,以便对移动用户进行下一步的筛选。
进一步地,所述根据所述通话数据,分别计算每个移动用户与所述目标用户的交往指数,具体包括:
根据所述通话数据,获取所述目标用户与每个移动用户的通话频率、通话次数和通话时长;
将所有移动用户按照通话次数的大小进行排序,并查询预设的通话次数排序得分表,获得每个移动用户所对应的通话次数得分;
将所有移动用户按照通话时长的大小进行排序,并查询预设的通话时长排序得分表,获得每个移动用户所对应的通话时长得分;
根据所述通话频率、所述通话次数得分和所述通话时长得分,采用交往指数算法,计算获得每个移动用户与所述目标用户的交往指数;
所述交往指数算法如下:
F=40*X+30*Y+30*Z;
其中,F为交往指数,X为交往频率,Y为通话次数得分,Z为通话时长得分。
需要说明的是,通话数据中可以看出目标用户与每个移动用户的通话频率、通话次数和通话时长,并分别针对每个移动用户进行通话次数打分和通话时长打分,进而根据这些分数计算出目标用户与每个移动用户之间的交往指数,交往指数大于预设交往阈值的移动用户才算是目标用户的有效交往用户,以纳入目标用户的交往圈,其中,预设交往阈值一般取50。
进一步地,所述家庭通话规则包括以下任意一种:
用户对中的目标用户和移动用户对其交往圈的总通话占比均大于40%,且通话总时长均大于50分钟;
用户对中的目标用户和移动用户的交往圈重合率达到20%,且对其交往圈的总通话占比均大于40%;
用户对中的目标用户和移动用户对其交往圈的源呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户对其交往圈的目标呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户的闲时通话基站重合率达到30%,且与其交往圈的通话次数均大于5次;
用户对中的目标用户和移动用户与其交往圈的通话次数大于15次,且周末通话基站重合率达到30%。
需要说明的是,用户对中的目标用户和移动用户对其交往圈的总通话占比均大于40%为,目标用户对其交往圈中所有用户的总通话占比大于40%,移动用户对其交往圈中所有用户的总通话占比也大于40%;用户对中的目标用户和移动用户对其交往圈的通话总时长均大于50分钟为,目标用户对其交往圈中所有用户的通话总时长大于50分钟,移动用户对其交往圈中所有用户的通话总时长也大于50分钟;用户对中的目标用户和移动用户的交往圈重合率达到20%为,目标用户和移动用户的交往圈重合的人数占目标用户交往圈的比例达到20%,占移动用户交往圈的比例也达到20%;用户对中的目标用户和移动用户对其交往圈的源呼出比例均大于45%为,目标用户呼叫其交往圈中所有用户的比例大于45%,移动用户呼叫其交往圈中所有用户的比例也大于45%;用户对中的目标用户和移动用户的闲时活动小区重合率达到30%为,目标用户和移动用户的用户终端闲时活动所重合的小区占目标用户的用户终端活动小区的比例达到30%,占移动用户的用户终端活动小区的比例也达到30%;用户对中的目标用户和移动用户对其交往圈的目标呼出比例均大于45%为,呼叫目标用户的用户中其交往圈中所有用户所占比例大于45%,呼叫移动用户的用户中其交往圈中所有用户所占比例也大于45%;用户对中的目标用户和移动用户的闲时或周末通话基站重合率达到30%为,目标用户和移动用户的用户终端闲时或周末通话所重合的基站占目标用户的用户终端通话基站的比例达到30%,占移动用户的用户终端通话基站的比例也达到30%;用户对中的目标用户和移动用户与其交往圈的通话次数均大于5次为,目标用户与其交往圈中所有用户的通话总次数大于5次,移动用户与其交往圈中所有用户的通话总次数也大于5次。
利用预设的家庭通话规则,通过决策树的分类能力对保留的移动用户进行第三次筛选。在目标用户与保留的移动用户所组成的每组用户对中,只要用户对中的目标用户和移动用户的通信数据满足家庭通话规则中的任意一种规则,则认为该用户对中的移动用户有可能是目标用户的家庭用户,保留该移动用户作为目标用户的家庭候选用户。
进一步地,所述关联阈值包括支持度阈值和置信度阈值;
所述对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户,具体包括:
获取所述目标用户及其家庭候选用户之间的所有交往对的通话关系;
对获取的所有通话关系进行关联规则处理,获得每个交往对的支持度和置信度;
提取所述支持度满足所述支持度阈值,且置信度满足所述置信度阈值的交往对,并将提取的交往对中的家庭候选用户作为所述目标用户的家庭用户。
需要说明的是,在获取目标用户的家庭候选用户后,需对家庭候选用户进行第四次筛选。从通话数据中可获取目标用户及其家庭候选用户之间的交往对,即一个用户呼叫另一个用户的通话关系,将获取的所有通话关系进行关联规则处理,计算每个交往对的支持度和置信度,其中,支持度为交往对中同时出现两个用户的概率,置信度为交往对中出现一个用户的情况下出现另一个用户的概率。提取大于预设支持度阈值且大于预设置信度阈值的交往对,提取的交往对中的所有用户即构成一个家庭圈子,该家庭圈子中的所有移动用户即为目标用户的家庭用户。
进一步地,所述用户关系预测方法还包括:
根据获取的所有通话关系,采用频繁模式增长算法,从所述目标用户及其家庭用户中识别出家庭户主。
需要说明的是,在识别家庭用户的同时,本发明实施例还可采用频繁模式增长算法,即FP-growth算法对交往对的通话关系进行处理,高效发现频繁项集,例如,对于A、B、C、D用户,采用频繁模式增长算法发现A->B->C->D,且交往对AB、BA、AC、AD、DA、CB的支持度和置信度均大于预设阈值,则将A、B、C、D构成一个家庭圈子,而A为该家庭圈子的户主,其中,户主是在家庭圈子中具有主动性,在通信中处于主动地位的用户。本发明实施例计算复杂度不高,算法仅仅考虑用户交往网络的拓扑结构等因素,省去了传统考虑多种社会因素进行建模的麻烦,而且户主在网络节点的活跃度为营销推广的关键,同时,利用关联规则识别家庭用户,利用频繁模式增长算法识别户主具有一定的创新性。
针对本发明实施例,通过联通内部用户的抽样验证来进行检验,本次验证主要提取了公司各部门员工的家庭用户数据,通过对业务支撑部门员工、市场部门员工、以及各分公司员工进行问卷调研后发现,抽样的家庭用户数据中58%为家庭成员,22%为密友,因此,抽样内部人员进行识别的准确率高达80%。
本发明实施例提供的家庭用户的识别方法,能够将目标用户分别与其通话的移动用户组成用户对,并根据其通话数据从移动用户中检测出目标用户的家庭候选用户,再结合关联规则对目标用户及其家庭候选用户之间的通话关系进行处理,以从家庭候选用户中识别出目标用户的家庭用户,实现家庭用户的快速、准确识别;采用频繁模式增长算法对目标用户及其家庭候选用户之间的通话关系进行处理,以识别出目标用户及其家庭用户所构成的家庭圈子中的户主,更有利于运营商在市场营销中抓住关键的人物。
相应的,本发明还提供一种家庭用户的识别装置,能够实现上述实施例中的家庭用户的识别方法的所有流程。
参见图2,是本发明提供的家庭用户的识别装置的一个实施例的结构示意图,包括:
数据提取模块1,用于分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据;所述通话数据包括用户终端发生通话的时间和基站识别码;
用户对组成模块2,用于将所述目标用户分别与每个移动用户组成一组用户对;
检测模块3,用于对每组用户对的通话数据进行检测,并在检测到所述用户对的通话数据满足预设的家庭通话规则时,将所述用户对中的移动用户作为所述目标用户的家庭候选用户;以及,
家庭用户获取模块4,用于对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户。
进一步地,所述数据提取模块1具体包括:
话单获取单元,用于获取在预设时间段内与预设的目标用户通话的移动用户的话单;
去除单元,用于去除所述话单为外省公司漫游话单、客服话单、公共服务性话单的移动用户;以及,
提取单元,用于分别提取所述目标用户和保留的每个移动用户在预设时间段内的通话数据。
进一步地,所述家庭用户的识别装置还包括:
交往指数计算模块,用于根据所述通话数据,分别计算每个移动用户与所述目标用户的交往指数;以及,
交往圈获取模块,用于去除所述交往指数低于预设交往阈值的移动用户,并将保留的移动用户添加到所述目标用户的交往圈中。
进一步地,所述交往指数计算模块具体包括:
数据获取单元,用于根据所述通话数据,获取所述目标用户与每个移动用户的通话频率、通话次数和通话时长;
第一得分获取单元,用于将所有移动用户按照通话次数的大小进行排序,并查询预设的通话次数排序得分表,获得每个移动用户所对应的通话次数得分;
第二得分获取单元,用于将所有移动用户按照通话时长的大小进行排序,并查询预设的通话时长排序得分表,获得每个移动用户所对应的通话时长得分;以及,
计算单元,用于根据所述通话频率、所述通话次数得分和所述通话时长得分,采用交往指数算法,计算获得每个移动用户与所述目标用户的交往指数;
所述交往指数算法如下:
F=40*X+30*Y+30*Z;
其中,F为交往指数,X为通话频率,Y为通话次数得分,Z为通话时长得分。
进一步地,所述家庭通话规则包括以下任意一种:
用户对中的目标用户和移动用户对其交往圈的总通话占比均大于40%,且通话总时长均大于50分钟;
用户对中的目标用户和移动用户的交往圈重合率达到20%,且对其交往圈的总通话占比均大于40%;
用户对中的目标用户和移动用户对其交往圈的源呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户对其交往圈的目标呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户的闲时通话基站重合率达到30%,且与其交往圈的通话次数均大于5次;
用户对中的目标用户和移动用户与其交往圈的通话次数大于15次,且周末通话基站重合率达到30%。
进一步地,所述关联阈值包括支持度阈值和置信度阈值;
所述家庭用户获取模块具体包括:
通话关系获取单元,用于获取所述目标用户及其家庭候选用户之间的所有交往对的通话关系;
数据获取单元,用于对获取的所有通话关系进行关联规则处理,获得每个交往对的支持度和置信度;以及,
家庭用户获取单元,用于提取所述支持度满足所述支持度阈值,且置信度满足所述置信度阈值的交往对,并将提取的交往对中的家庭候选用户作为所述目标用户的家庭用户。
进一步地,所述家庭用户的识别装置还包括:
户主识别模块,用于根据获取的所有通话关系,采用频繁模式增长算法,从所述目标用户及其家庭用户中识别出家庭户主。
本发明实施例提供的家庭用户的识别装置,能够将目标用户分别与其通话的移动用户组成用户对,并根据其通话数据从移动用户中检测出目标用户的家庭候选用户,再结合关联规则对目标用户及其家庭候选用户之间的通话关系进行处理,以从家庭候选用户中识别出目标用户的家庭用户,实现家庭用户的快速、准确识别;采用频繁模式增长算法对目标用户及其家庭候选用户之间的通话关系进行处理,以识别出目标用户及其家庭用户所构成的家庭圈子中的户主,更有利于运营商在市场营销中抓住关键的人物。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (8)
1.一种家庭用户的识别方法,其特征在于,包括:
分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据;所述通话数据包括用户终端发生通话的时间和基站识别码;
将所述目标用户分别与每个移动用户组成一组用户对;
对每组用户对的通话数据进行检测,并在检测到所述用户对的通话数据满足预设的家庭通话规则时,将所述用户对中的移动用户作为所述目标用户的家庭候选用户;
对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户;
其中,所述关联阈值包括支持度阈值和置信度阈值;
所述对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户,具体包括:
获取所述目标用户及其家庭候选用户之间的所有交往对的通话关系;
对获取的所有通话关系进行关联规则处理,获得每个交往对的支持度和置信度;其中,支持度为交往对中同时出现两个用户的概率,置信度为交往对中出现一个用户的情况下出现另一个用户的概率;
提取所述支持度满足所述支持度阈值,且置信度满足所述置信度阈值的交往对,并将提取的交往对中的家庭候选用户作为所述目标用户的家庭用户。
2.如权利要求1所述的家庭用户的识别方法,其特征在于,所述分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据,具体包括:
获取在预设时间段内与预设的目标用户通话的移动用户的话单;
去除所述话单为外省公司漫游话单、客服话单、公共服务性话单的移动用户;
分别提取所述目标用户和保留的每个移动用户在预设时间段内的通话数据。
3.如权利要求1所述的家庭用户的识别方法,其特征在于,在所述将所述目标用户分别与每个移动用户组成一组用户对之前,还包括:
根据所述通话数据,分别计算每个移动用户与所述目标用户的交往指数;
去除所述交往指数低于预设交往阈值的移动用户,并将保留的移动用户添加到所述目标用户的交往圈中。
4.如权利要求3所述的家庭用户的识别方法,其特征在于,所述根据所述通话数据,分别计算每个移动用户与所述目标用户的交往指数,具体包括:
根据所述通话数据,获取所述目标用户与每个移动用户的通话频率、通话次数和通话时长;
将所有移动用户按照通话次数的大小进行排序,并查询预设的通话次数排序得分表,获得每个移动用户所对应的通话次数得分;
将所有移动用户按照通话时长的大小进行排序,并查询预设的通话时长排序得分表,获得每个移动用户所对应的通话时长得分;
根据所述通话频率、所述通话次数得分和所述通话时长得分,采用交往指数算法,计算获得每个移动用户与所述目标用户的交往指数;
所述交往指数算法如下:
F=40*X+30*Y+30*Z;
其中,F为交往指数,X为通话频率,Y为通话次数得分,Z为通话时长得分。
5.如权利要求3所述的家庭用户的识别方法,其特征在于,所述家庭通话规则包括以下任意一种:
用户对中的目标用户和移动用户对其交往圈的总通话占比均大于40%,且通话总时长均大于50分钟;
用户对中的目标用户和移动用户的交往圈重合率达到20%,且对其交往圈的总通话占比均大于40%;
用户对中的目标用户和移动用户对其交往圈的源呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户对其交往圈的目标呼出比例均大于45%,交往圈重合率达到20%,且闲时活动小区重合率达到30%;
用户对中的目标用户和移动用户的闲时通话基站重合率达到30%,且与其交往圈的通话次数均大于5次;
用户对中的目标用户和移动用户与其交往圈的通话次数大于15次,且周末通话基站重合率达到30%。
6.如权利要求5所述的家庭用户的识别方法,其特征在于,所述家庭用户的识别方法还包括:
根据获取的所有通话关系,采用频繁模式增长算法,从所述目标用户及其家庭用户中识别出家庭户主。
7.一种家庭用户的识别装置,其特征在于,包括:
数据提取模块,用于分别提取预设的目标用户以及与所述目标用户在预设时间段内通话的每个移动用户的通话数据;所述通话数据包括用户终端发生通话的时间和基站识别码;
用户对组成模块,用于将所述目标用户分别与每个移动用户组成一组用户对;
检测模块,用于对每组用户对的通话数据进行检测,并在检测到所述用户对的通话数据满足预设的家庭通话规则时,将所述用户对中的移动用户作为所述目标用户的家庭候选用户;以及,
家庭用户获取模块,用于对所述目标用户及其家庭候选用户之间的通话关系进行关联规则处理,将满足关联阈值的家庭候选用户作为所述目标用户的家庭用户;
其中,所述关联阈值包括支持度阈值和置信度阈值;
所述家庭用户获取模块具体包括:
通话关系获取单元,用于获取所述目标用户及其家庭候选用户之间的所有交往对的通话关系;
数据获取单元,用于对获取的所有通话关系进行关联规则处理,获得每个交往对的支持度和置信度;其中,支持度为交往对中同时出现两个用户的概率,置信度为交往对中出现一个用户的情况下出现另一个用户的概率;以及,
家庭用户获取单元,用于提取所述支持度满足所述支持度阈值,且置信度满足所述置信度阈值的交往对,并将提取的交往对中的家庭候选用户作为所述目标用户的家庭用户。
8.如权利要求7所述的家庭用户的识别装置,其特征在于,所述家庭用户的识别装置还包括:
户主识别模块,用于根据获取的所有通话关系,采用频繁模式增长算法,从所述目标用户及其家庭用户中识别出家庭户主。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611024350.7A CN106658564B (zh) | 2016-11-17 | 2016-11-17 | 一种家庭用户的识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611024350.7A CN106658564B (zh) | 2016-11-17 | 2016-11-17 | 一种家庭用户的识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106658564A CN106658564A (zh) | 2017-05-10 |
CN106658564B true CN106658564B (zh) | 2019-10-25 |
Family
ID=58808837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611024350.7A Active CN106658564B (zh) | 2016-11-17 | 2016-11-17 | 一种家庭用户的识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106658564B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110677446A (zh) * | 2018-07-03 | 2020-01-10 | 中移(杭州)信息技术有限公司 | 一种家庭群组用户的识别方法及装置 |
CN110856159B (zh) * | 2018-08-21 | 2022-07-26 | 中国移动通信集团湖南有限公司 | 确定家庭圈成员的方法、装置及存储介质 |
CN109639478A (zh) * | 2018-12-07 | 2019-04-16 | 中国移动通信集团江苏有限公司 | 识别存在家庭关系客户的方法、装置、设备及介质 |
CN109982312B (zh) * | 2019-03-28 | 2021-10-15 | 中国联合网络通信集团有限公司 | 一种转副卡行为识别方法、识别装置和服务器 |
CN113378073B (zh) * | 2020-03-10 | 2023-04-07 | 中国移动通信集团湖南有限公司 | 用户关系的识别方法及装置 |
CN113657635B (zh) * | 2020-05-12 | 2023-10-27 | 中国移动通信集团湖南有限公司 | 一种预测通信用户流失的方法及电子设备 |
CN114125815B (zh) * | 2021-11-26 | 2023-06-30 | 中国联合网络通信集团有限公司 | 一种身份识别方法、装置及计算机可读存储介质 |
CN114446427A (zh) * | 2021-12-28 | 2022-05-06 | 海信集团控股股份有限公司 | 电子设备及健康数据归属识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101841607A (zh) * | 2010-04-28 | 2010-09-22 | 深圳天源迪科信息技术股份有限公司 | 获取固话与手机间家庭关联关系的方法 |
CN102215504A (zh) * | 2010-04-08 | 2011-10-12 | 中国移动通信集团甘肃有限公司 | 新入网用户的类别识别方法及系统 |
CN102541886A (zh) * | 2010-12-20 | 2012-07-04 | 郝敬涛 | 一种识别用户群和用户之间关系的系统和方法 |
CN104244314A (zh) * | 2014-07-30 | 2014-12-24 | 北京拓明科技有限公司 | 一种基于Mc接口信令的潜在集团客户识别方法 |
CN105160547A (zh) * | 2015-08-07 | 2015-12-16 | 北京思特奇信息技术股份有限公司 | 一种基于稳定交往指数的跨网关系识别方法及系统 |
-
2016
- 2016-11-17 CN CN201611024350.7A patent/CN106658564B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102215504A (zh) * | 2010-04-08 | 2011-10-12 | 中国移动通信集团甘肃有限公司 | 新入网用户的类别识别方法及系统 |
CN101841607A (zh) * | 2010-04-28 | 2010-09-22 | 深圳天源迪科信息技术股份有限公司 | 获取固话与手机间家庭关联关系的方法 |
CN102541886A (zh) * | 2010-12-20 | 2012-07-04 | 郝敬涛 | 一种识别用户群和用户之间关系的系统和方法 |
CN104244314A (zh) * | 2014-07-30 | 2014-12-24 | 北京拓明科技有限公司 | 一种基于Mc接口信令的潜在集团客户识别方法 |
CN105160547A (zh) * | 2015-08-07 | 2015-12-16 | 北京思特奇信息技术股份有限公司 | 一种基于稳定交往指数的跨网关系识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106658564A (zh) | 2017-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106658564B (zh) | 一种家庭用户的识别方法及装置 | |
CN104636439B (zh) | 一种分析用户社会关系的方法及装置 | |
WO2017186090A1 (zh) | 通信号码处理方法及装置 | |
CN104883671B (zh) | 一种垃圾短信的判断方法及系统 | |
CN104038648A (zh) | 骚扰电话的识别方法和装置 | |
CN102215504A (zh) | 新入网用户的类别识别方法及系统 | |
CN102438205B (zh) | 一种基于移动用户行为的业务推送的方法与系统 | |
CN101860822A (zh) | 垃圾短信监控方法和系统 | |
CN110337059A (zh) | 一种用户家庭关系的分析算法、服务器及网络系统 | |
CN102387461A (zh) | 一种移动数据业务推荐方法、装置和系统 | |
CN113412607B (zh) | 内容推送方法、装置、移动终端及存储介质 | |
CN110705926A (zh) | 一种物流对象配送信息的获取方法、装置和系统 | |
CN104994210A (zh) | 一种基于通信频度的通讯录排序方法及系统 | |
US10395261B2 (en) | Identifying and scoring key influencers in a network | |
CN106791227B (zh) | 一种基于通话数据来识别用户常用联系人的方法和系统 | |
CN110536302A (zh) | 电信诈骗提醒方法和装置 | |
CN106982284A (zh) | 骚扰电话号码的识别方法及装置 | |
CN103458507B (zh) | 一种基于移动终端的蓝牙网络应用方法及系统 | |
CN108696858B (zh) | 一种基于手机号码建立社交关系的方法和系统 | |
CN104410694B (zh) | 一种基于数据挖掘的云端通信录联系方式自主更新方法 | |
CN103873698A (zh) | 终端关联装置和终端关联方法 | |
CN105160547A (zh) | 一种基于稳定交往指数的跨网关系识别方法及系统 | |
CN106875276A (zh) | 一种通信用户社交圈生成方法及系统 | |
CN108512891A (zh) | 基于即时位置的数据推送方法及后台服务器 | |
CN106911660A (zh) | 一种信息管理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |