CN108738036B - 移动通信的关键用户提取方法和系统 - Google Patents
移动通信的关键用户提取方法和系统 Download PDFInfo
- Publication number
- CN108738036B CN108738036B CN201710244245.2A CN201710244245A CN108738036B CN 108738036 B CN108738036 B CN 108738036B CN 201710244245 A CN201710244245 A CN 201710244245A CN 108738036 B CN108738036 B CN 108738036B
- Authority
- CN
- China
- Prior art keywords
- user
- identifier
- identifiers
- identification
- user identifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
Abstract
本发明涉及一种移动通信的关键用户提取方法和系统,该方法包括:获取用户呼叫详单、根据用户呼叫详单获取用户标识并生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;依次选取各用户标识,从有向通信网络中查找对应的中间标识、同邻标识、终点标识;获取多个数据,包括:中间标识的数量、同邻标识的数量、终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值和有向通信网络的节点总数、用户标识与对应中间标识的通话时长、中间标识与所有对应同邻标识的通话总时长;根据获取的数据获取用户标识的排列值;根据排列值选取关键用户的用户标识。如此,提取关键用户的准确性高。
Description
技术领域
本发明涉及移动通信技术领域,特别是涉及一种移动通信的关键用户提取方法和系统。
背景技术
随着移动通信以及移动互联网应用的快速发展,人类社会已经进入了以社交工具为核心的“网络时代”。“网络时代”下,移动运营商、电商工作人员等为了给用户提供具有针对性的服务,比如套餐推荐、产品营销等,通常需要对通信网络中用户的数据进行数据挖掘,从通信网络中提取出重要性比较高的关键用户。
传统的从通信网络中提取关键用户的方法,一般是简单根据用户本身的通信次数、通信时间等信息,分析用户使用通话功能的程度高低来判断用户在通信网络中所占的重要程度,没有考虑主叫用户与被叫用户的通话方向性,准确性低。比如,中介公司的推销人员经常给客户打电话,如果仅从通话次数和通话时间来考虑的话,推销人员需要给众多客户打电话,通话次数比客户的通话次数多,得到的结果是推销人员的重要性比客户高,是比较片面的。
发明内容
基于此,有必要针对传统的关键用户提取方法准确性低的问题,提供一种准确性高的移动通信的关键用户提取方法和系统。
一种移动通信的关键用户提取方法,包括:
获取用户呼叫详单,从所述用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;
依次选取各用户标识,从所述有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识;
分别获取各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值和所述有向通信网络的节点总数,以及根据所述用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长;
分别根据各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值、所述节点总数、各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长获取各被选取的用户标识的排列值;
按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。
一种移动通信的关键用户提取系统,包括:
详单分析模块,用于获取用户呼叫详单,从所述用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;
标识查找模块,用于依次选取各用户标识,从所述有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识;
数据获取模块,用于分别获取各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值和所述有向通信网络的节点总数,以及根据所述用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长;
排列值获取模块,用于分别根据各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值、所述节点总数、各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长获取各被选取的用户标识的排列值;
标识提取模块,用于按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。
上述移动通信的关键用户提取方法和系统,通过根据获取的用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;然后依次选取各用户标识,从有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被中间标识指向的用户标识得到同邻标识,查找包括中间标识在内、指向同邻标识的用户标识得到终点标识,从而获取多个数据,包括:各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值和有向通信网络的节点总数,以及根据用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、中间标识与所有对应同邻标识的通话总时长;再根据获取的数据获取各被选取的用户标识的排列值;最后按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。如此,在获取表示用户重要性的用户标识的排序值过程中,将通话的有向性考虑在内,数据挖掘效果好,提取关键用户的准确性高。
附图说明
图1为一实施例中移动通信的关键用户提取方法的流程图;
图2为另一实施例中移动通信的关键用户提取方法的流程图;
图3为一具体实施例中更新后的有向通信网络的示意图;
图4为一实施例中移动通信的关键用户提取系统的结构图。
具体实施方式
参考图1,一实施例中的移动通信的关键用户提取方法,包括如下步骤。
S110:获取用户呼叫详单,从用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络。
其中,用户标识为用于识别用户的号码,如电话号码。用户呼叫详单包括通话对象、通话开始时刻和通话结束时刻等信息;其中,通话对象包括主叫用户的用户标识和被叫用户的用户标识。相互通话的两个用户对应的用户标识之间具有通话关系。例如,一具体实施例中的用户呼叫详单如下表1所示。
表1
主叫用户 | 通话开始时间 | 通话结束时间 | 被叫用户 |
185****1223 | 8:23:34 | 8:26:39 | 185****2987 |
185****2224 | 11:03:45 | 11:23:40 | 185****9188 |
185****3425 | 10:23:34 | 11:23:40 | 185****2989 |
…… | …… | …… | …… |
185****1451 | 11:20:34 | 12:03:40 | 185****2982 |
用户呼叫详单可以从移动运营商的服务器获取,具体地,可以是按照预设间隔获取用户呼叫详单,此时获取的用户呼叫详单为前一次获取用户呼叫详单到此次获取用户呼叫详单的时间段内用户通话生成的用户呼叫详单。通过生成有向通信网络,可以直观地反映各用户标识之间的主叫或被叫的关系。
S130:依次选取各用户标识,从有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被中间标识指向的用户标识得到同邻标识,查找包括中间标识在内、指向同邻标识的用户标识得到终点标识。
依次选取用户标识、查找对应的中间标识、同邻标识、终点标识,从而对有向通信网络中的各个用户标识均进行分析。有向通信网络中的用户标识之间的指向反映主叫与被叫的关系;中间标识指向被选取的用户标识,表示中间标识为拨打给被选取的用户标识的主叫号码,一个被选取的用户标识可对应查找到多个中间标识;中间标识指向同邻标识,表示中间标识为拨打给同邻标识的主叫号码,一个中间标识可对应查找到多个同邻标识;终点标识指向同邻标识,表示终点标识为拨打给同邻标识的主叫号码,一个同邻标识可对应查找到多个终点标识。
S150:分别获取各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值和有向通信网络的节点总数,以及根据用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、中间标识与所有对应同邻标识的通话总时长。
中间标识的数量、同邻标识的数量、终点标识的数量和节点总数可以通过对有向通信网络中对应类型的节点进行计数得到。被选取的用户标识与对应中间标识之间的通话时长可以通过查找用户呼叫详单中对应的用户标识之间的通话开始时刻和通话结束时刻进行计算得到。
S170:分别根据各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值、节点总数、各被选取的用户标识与对应中间标识之间的通话时长、中间标识与所有对应同邻标识的通话总时长获取各被选取的用户标识的排列值。
被选取的用户标识、中间标识、同邻标识和终点标识之间依次存在主叫与被叫的关系,各被选取的用户标识的排列值根据对应的中间标识、同邻标识和终点标识的相关数据获取得到,将用户标识之间通话的方向性考虑在内。
S190:按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。
排列值考虑了用户标识之间通话的方向性,可准确反映对应用户标识的重要程度。具体地,排列值越大,标识重要程度越高。通过按照排列值的大小顺序进行选取,可从众多用户标识中优先选取出重要程度高的用户标识,从而提取出对应的关键用户。
上述移动通信的关键用户提取方法,通过根据获取的用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;然后依次选取各用户标识,从有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被中间标识指向的用户标识得到同邻标识,查找包括中间标识在内、指向同邻标识的用户标识得到终点标识,从而获取多个数据,包括:各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值和有向通信网络的节点总数,以及根据用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、中间标识与所有对应同邻标识的通话总时长;再根据获取的数据获取各被选取的用户标识的排列值;最后按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。如此,在获取表示用户重要性的用户标识的排序值过程中,将通话的有向性考虑在内,数据挖掘效果好,提取关键用户的准确性高。
参考图2,一实施例中,步骤S110之后,步骤S130之前,还包括步骤S121至步骤S124。
S121:根据用户呼叫详单分别获取各用户标识的通话信息。
每一个用户标识对应有各自的通话信息,通话信息从用户呼叫详单中获取,包括所属用户标识与其他有通话关系的用户标识之间通话的信息,例如可以包括通话时长、通话次数等信息。
具体地,用户标识的通话信息可以是按照间隔获取,此时,获取的通话信息由前一次获取通话信息之后到此次获取通话信息的时间段内用户标识之间的通话行为生成。
S122:根据通话信息获取对应用户标识与有通话关系的各用户标识之间的有效交往度。
有效交往度用于表示两个用户标识之间发生通信行为的相对重要度和紧密程度。一个用户标识对应的有效交往度的数量与该用户标识对应的有通话关系的其他用户标识的数量相等。例如,用户A1分别与用户A2、用户A3、用户A4进行了通话,则用户A1对应的用户标识与用户A2、用户A3、用户A4对应的用户标识均有通话关系,根据用户A1的用户标识的通话信息可获取用户A1的用户标识与用户A2的用户标识之间的有效交往度、用户A1的用户标识与用户A3的用户标识之间的有效交往度、用户A1的用户标识与用户A4的用户标识之间的有效交往度。
S123:分别根据各用户标识与有通话关系的用户标识之间的有效交往度获取对应用户标识的非有效交往用户标识。
用户标识与有通话关系的用户标识之间的有效交往度的大小体现了对应两个用户标识之间的相对重要度和紧密程度的大小,用户标识的非有效交往用户标识表示与对应用户标识之间的重要度和紧密程度比较低,影响比较小。通过对有效交往度的大小进行分析,可以判断有通话关系的用户标识是否为非有效交往用户标识。
具体地,步骤S123可以包括:判断用户标识与有通话关系的用户标识之间的有效交往度是否大于或等于预设阈值;若是,则将对应有通话关系的用户标识作为有效交往用户标识;若否,则将对应有通话关系的用户标识作为非有效交往用户标识。
S124:将有向通信网络中各用户标识的非有效交往用户标识删除,得到更新后的有向通信网络。
通过将重要度和紧密程度比较低的非有效交往用户标识删除,可得到优化的有向通信网络。
对应地,步骤S130为:依次选取各用户标识,从更新后的有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被中间标识指向的用户标识得到同邻标识,查找包括中间标识在内、指向同邻标识的用户标识得到终点标识。对应地,步骤S150中获取的节点总数为更新后的有向通信网络对应的节点总数。
通过步骤S121至步骤S124,获取各用户标识的非有效交往用户标识后对有向通信网络进行更新,使步骤S130和步骤S150基于更新后的有向通信网络进行操作,可有效剔除有向通信网络的噪音节点、提高关键用户提取准确性,且简化后续的排列值计算。
例如,参考图3,为一具体实施例中更新后的有向通信网路的示意图。用户标识T1、用户标识T2、用户标识T3、用户标识T4为指向用户标识A的中间标识,即用户标识T1、用户标识T2、用户标识T3、用户标识T4对应的用户拨打电话给用户标识A的用户;用户标识M4、用户标识M5和用户标识A为中间标识T2对应的同邻标识;用户标识N1、用户标识N2、用户标识N3、用户标识N4、用户标识T2为同邻标识M4对应的终点标识。
在一实施例中,通信信息包括与对应用户标识有通话关系的用户标识的总数目、对应用户标识与有通话关系的各用户标识之间的通话时长、对应用户标识与有通话关系的各用户标识之间的通话次数、对应用户标识与有通话关系的所有用户标识的通话总时长、对应用户标识与有通话关系的所有用户标识的通话总次数。
步骤S122包括:
TF-IDFTA=wTA*tfTA*idfTA;
其中,TF-IDFTA为用户标识T与有通话关系的用户标识A之间的有效交往度,与用户标识T有通话关系的用户标识A的数量有多个,wTA为用户标识T与用户标识A的通话时长占用用户标识T与有通话关系的所有用户标识的通话总时长的比例,tfTA为用户标识T与用户标识A的通话次数除以用户标识T与有通话关系的所有用户标识的通话总次数的值,idfTA为用户标识T与有通话关系的所有用户标识的通话总时长除以与用户标识T有通话关系的用户标识的总数目的值。
通过在统计通话次数的基础上,结合通话时长和有通话关系的用户标识的总数目等数据,计算用户标识之间的重要度和紧密程度,以此来甄别有效交往用户标识和非有效交往用户标识,准确性高。
在一实施例中,步骤S170,包括:
其中,PR(A)为被选取的用户标识A的排列值,d为预设阻尼系数,N为节点总数,i为被选取的用户标识A对应的中间标识的序号,n为被选取的用户标识A对应的中间标识的数量,mi第i个中间标识对应的同邻标识的数量,j为同邻标识的序号,INj为第j个同邻标识对应的终点标识的数量,PR(Ti)为被选取的用户标识A对应的第i个中间标识的排列值,wAi为第i个中间标识指向被选取的用户标识A的边权值,wMj为第i个中间标识指向第j个同邻标识的边权值,WTi为被选取的用户标识A与第i个中间标识之间的通话时长占用第i个中间标识与所有对应同邻标识的通话总时长的比例。
其中,公式(1)的细化为:
通过采用公式(1)计算得到各用户标识的排列值,可以准确反映出用户标识在有向通信网络中的重要性,从而进一步提高根据排列度提取关键用户的准确性。
具体地,中间标识指向被选取的用户标识的边权值为中间标识的排列值除以指向被选取的用户标识的所有中间标识的排列值之和;中间标识指向同邻标识的边权值为中间标识的排列值除以指向同邻标识的所有终点标识的排列值之和。
参考图4,一实施例中的移动通信的关键用户提取系统,包括详单分析模块110、标识查找模块120、数据获取模块130、排列值获取模块140和标识提取模块150。
详单分析模块110用于获取用户呼叫详单,从用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络。
标识查找模块120用于依次选取各用户标识,从有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被中间标识指向的用户标识得到同邻标识,查找包括中间标识在内、指向同邻标识的用户标识得到终点标识。
数据获取模块130用于分别获取各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值和有向通信网络的节点总数,以及根据用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、中间标识与所有对应同邻标识的通话总时长。
排列值获取模块140用于分别根据各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值、节点总数、各被选取的用户标识与对应中间标识之间的通话时长、中间标识与所有对应同邻标识的通话总时长获取各被选取的用户标识的排列值。
标识提取模块150用于按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。
上述移动通信的关键用户提取系统,通过详单分析模块110根据获取的用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;然后标识查找模块120依次选取各用户标识,从有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被中间标识指向的用户标识得到同邻标识,查找包括中间标识在内、指向同邻标识的用户标识得到终点标识,数据获取模块130获取多个数据,包括:各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、中间标识指向被选取的用户标识的边权值、中间标识指向同邻标识的边权值、中间标识的排列值和有向通信网络的节点总数,以及根据用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、中间标识与所有对应同邻标识的通话总时长;排列值获取模块140根据获取的数据获取各被选取的用户标识的排列值;最后标识提取模块150按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。如此,在获取表示用户重要性的用户标识的排序值过程中,将通话的有向性考虑在内,数据挖掘效果好,提取关键用户的准确性高。
在一实施例中,上述移动通信的关键用户提取系统还包括网络更新模块(图未示),用于在详单分析模块生成有向通信网络后,根据用户呼叫详单分别获取各用户标识的通话信息,根据通话信息获取对应用户标识与有通话关系的各用户标识之间的有效交往度,分别根据各用户标识与有通话关系的用户标识之间的有效交往度获取对应用户标识的非有效交往用户标识,将有向通信网络中各用户标识的非有效交往用户标识删除,得到更新后的有向通信网络。
对应地,标识查找模块120具体用于依次选取各用户标识,从更新后的有向通信网络中分别查找指向被选取的用户标识的用户标识得到中间标识,查找包括被选取的用户标识在内、被中间标识指向的用户标识得到同邻标识,查找包括中间标识在内、指向同邻标识的用户标识得到终点标识。数据获取模块130获取的节点总数为更新后的有向通信网络对应的节点总数。
通过网络更新模块获取各用户标识的非有效交往用户标识后对有向通信网络进行更新,使标识查找模块120和数据获取模块130基于更新后的有向通信网络进行操作,可有效剔除有向通信网络的噪音节点、提高关键用户提取准确性,且简化后续的排列值计算。
在一实施例中,通信信息包括与对应用户标识有通话关系的用户标识的总数目、对应用户标识与有通话关系的各用户标识之间的通话时长、对应用户标识与有通话关系的各用户标识之间的通话次数、对应用户标识与有通话关系的所有用户标识的通话总时长、对应用户标识与有通话关系的所有用户标识的通话总次数。
网络更新模块根据:
TF-IDFTA=wTA*tfTA*idfTA;
获取对应用户标识与有通话关系的各用户标识之间的有效交往度;
其中,TF-IDFTA为用户标识T与有通话关系的用户标识A之间的有效交往度,与用户标识T有通话关系的用户标识A的数量有多个,wTA为用户标识T与用户标识A的通话时长占用用户标识T与有通话关系的所有用户标识的通话总时长的比例,tfTA为用户标识T与用户标识A的通话次数除以用户标识T与有通话关系的所有用户标识的通话总次数的值,idfTA为用户标识T与有通话关系的所有用户标识的通话总时长除以与用户标识T有通话关系的用户标识的总数目的值。
通过在统计通话次数的基础上,结合通话时长和有通话关系的用户标识的总数目等数据,计算用户标识之间的重要度和紧密程度,以此来甄别有效交往用户标识和非有效交往用户标识,准确性高。
在一实施例中,排列值获取模块140根据:
获取各被选取的用户标识的排列值;
其中,PR(A)为被选取的用户标识A的排列值,d为预设阻尼系数,N为节点总数,i为被选取的用户标识A对应的中间标识的序号,n为被选取的用户标识A对应的中间标识的数量,mi第i个中间标识对应的同邻标识的数量,j为同邻标识的序号,INj为第j个同邻标识对应的终点标识的数量,PR(Ti)为被选取的用户标识A对应的第i个中间标识的排列值,wAi为第i个中间标识指向被选取的用户标识A的边权值,wMj为第i个中间标识指向第j个同邻标识的边权值,WTi为被选取的用户标识A与第i个中间标识之间的通话时长占用第i个中间标识与所有对应同邻标识的通话总时长的比例。
具体地,中间标识指向被选取的用户标识的边权值为中间标识的排列值除以指向被选取的用户标识的所有中间标识的排列值之和;
中间标识指向同邻标识的边权值为中间标识的排列值除以指向同邻标识的所有终点标识的排列值之和。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (8)
1.一种移动通信的关键用户提取方法,其特征在于,包括:
获取用户呼叫详单,从所述用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;
依次选取各用户标识,从所述有向通信网络中分别查找指向被选取的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识;
分别获取各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值和所述有向通信网络的节点总数,以及根据所述用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长;
分别根据各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值、所述节点总数、各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长获取各被选取的用户标识的排列值;
所述排列值的计算公式为:
其中,PR(A)为被选取的用户标识A的排列值,d为预设阻尼系数,N为所述节点总数,i为被选取的用户标识A对应的中间标识的序号,n为被选取的用户标识A对应的中间标识的数量,mi第i个中间标识对应的同邻标识的数量,j为同邻标识的序号,INj为第j个同邻标识对应的终点标识的数量,PR(Ti)为被选取的用户标识A对应的第i个中间标识的排列值,wAi为第i个中间标识指向被选取的用户标识A的边权值,wMj为第i个中间标识指向第j个同邻标识的边权值,WTi为被选取的用户标识A与第i个中间标识之间的通话时长占用第i个中间标识与所有对应同邻标识的通话总时长的比例;
按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。
2.根据权利要求1所述的移动通信的关键用户提取方法,其特征在于,所述获取用户呼叫详单,从所述用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络之后,所述依次选取各用户标识,从所述有向通信网络中分别查找指向被选取的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识之前,还包括:
根据所述用户呼叫详单分别获取各用户标识的通话信息;
根据所述通话信息获取对应用户标识与有通话关系的各用户标识之间的有效交往度;
分别根据各用户标识与有通话关系的用户标识之间的有效交往度获取对应用户标识的非有效交往用户标识;
将所述有向通信网络中各用户标识的非有效交往用户标识删除,得到更新后的有向通信网络;
所述依次选取各用户标识,从所述有向通信网络中分别查找指向被选取的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识,为:
依次选取各用户标识,从更新后的有向通信网络中分别查找指向被选取的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识;
所述节点总数为更新后的有向通信网络对应的节点总数。
3.根据权利要求2所述的移动通信的关键用户提取方法,其特征在于,所述通信信息包括与对应用户标识有通话关系的用户标识的总数目、对应用户标识与有通话关系的各用户标识之间的通话时长、对应用户标识与有通话关系的各用户标识之间的通话次数、对应用户标识与有通话关系的所有用户标识的通话总时长、对应用户标识与有通话关系的所有用户标识的通话总次数;
所述根据所述通话信息获取对应用户标识与有通话关系的各用户标识之间的有效交往度,包括:
TF-IDFTA=wTA*tfTA*idfTA;
其中,TF-IDFTA为用户标识T与有通话关系的用户标识A之间的有效交往度,与用户标识T有通话关系的用户标识A的数量有多个,wTA为用户标识T与用户标识A的通话时长占用用户标识T与有通话关系的所有用户标识的通话总时长的比例,tfTA为用户标识T与用户标识A的通话次数除以用户标识T与有通话关系的所有用户标识的通话总次数的值,idfTA为用户标识T与有通话关系的所有用户标识的通话总时长除以与用户标识T有通话关系的用户标识的总数目的值。
4.根据权利要求1所述的移动通信的关键用户提取方法,其特征在于,所述中间标识指向被选取的用户标识的边权值为所述中间标识的排列值除以指向被选取的用户标识的所有中间标识的排列值之和;
所述中间标识指向所述同邻标识的边权值为所述中间标识的排列值除以指向所述同邻标识的所有终点标识的排列值之和。
5.一种移动通信的关键用户提取系统,其特征在于,包括:
详单分析模块,用于获取用户呼叫详单,从所述用户呼叫详单中获取用户标识以及有通话关系的用户标识之间主叫与被叫的关系,并以各用户标识为节点、生成主叫的用户标识指向对应被叫的用户标识的有向通信网络;
标识查找模块,用于依次选取各用户标识,从所述有向通信网络中分别查找指向被选取的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识;
数据获取模块,用于分别获取各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值和所述有向通信网络的节点总数,以及根据所述用户呼叫详单获取各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长;
排列值获取模块,用于分别根据各被选取的用户标识对应的中间标识的数量、各中间标识对应的同邻标识的数量、各同邻标识对应的终点标识的数量、所述中间标识指向被选取的用户标识的边权值、所述中间标识指向所述同邻标识的边权值、所述中间标识的排列值、所述节点总数、各被选取的用户标识与对应中间标识之间的通话时长、所述中间标识与所有对应同邻标识的通话总时长获取各被选取的用户标识的排列值;
所述排列值获取模块根据:
获取各被选取的用户标识的排列值;
其中,PR(A)为被选取的用户标识A的排列值,d为预设阻尼系数,N为所述节点总数,i为被选取的用户标识A对应的中间标识的序号,n为被选取的用户标识A对应的中间标识的数量,mi第i个中间标识对应的同邻标识的数量,j为同邻标识的序号,INj为第j个同邻标识对应的终点标识的数量,PR(Ti)为被选取的用户标识A对应的第i个中间标识的排列值,wAi为第i个中间标识指向被选取的用户标识A的边权值,wMj为第i个中间标识指向第j个同邻标识的边权值,WTi为被选取的用户标识A与第i个中间标识之间的通话时长占用第i个中间标识与所有对应同邻标识的通话总时长的比例;
标识提取模块,用于按照从大到小的顺序从多个排列值中选取预设数量的排列值,将选取的排列值对应的用户标识作为关键用户的用户标识。
6.根据权利要求5所述的移动通信的关键用户提取系统,其特征在于,还包括网络更新模块,用于在所述详单分析模块生成所述有向通信网络后,根据所述用户呼叫详单分别获取各用户标识的通话信息,根据所述通话信息获取对应用户标识与有通话关系的各用户标识之间的有效交往度,分别根据各用户标识与有通话关系的用户标识之间的有效交往度获取对应用户标识的非有效交往用户标识,将所述有向通信网络中各用户标识的非有效交往用户标识删除,得到更新后的有向通信网络;
所述标识查找模块具体用于依次选取各用户标识,从更新后的有向通信网络中分别查找指向被选取的用户标识得到中间标识,查找包括被选取的用户标识在内、被所述中间标识指向的用户标识得到同邻标识,查找包括所述中间标识在内、指向所述同邻标识的用户标识得到终点标识;
所述数据获取模块获取的节点总数为更新后的有向通信网络对应的节点总数。
7.根据权利要求6所述的移动通信的关键用户提取系统,其特征在于,所述通信信息包括与对应用户标识有通话关系的用户标识的总数目、对应用户标识与有通话关系的各用户标识之间的通话时长、对应用户标识与有通话关系的各用户标识之间的通话次数、对应用户标识与有通话关系的所有用户标识的通话总时长、对应用户标识与有通话关系的所有用户标识的通话总次数;
所述网络更新模块根据:
TF-IDFTA=wTA*tfTA*idfTA;
获取对应用户标识与有通话关系的各用户标识之间的有效交往度;
其中,TF-IDFTA为用户标识T与有通话关系的用户标识A之间的有效交往度,与用户标识T有通话关系的用户标识A的数量有多个,wTA为用户标识T与用户标识A的通话时长占用用户标识T与有通话关系的所有用户标识的通话总时长的比例,tfTA为用户标识T与用户标识A的通话次数除以用户标识T与有通话关系的所有用户标识的通话总次数的值,idfTA为用户标识T与有通话关系的所有用户标识的通话总时长除以与用户标识T有通话关系的用户标识的总数目的值。
8.根据权利要求5所述的移动通信的关键用户提取系统,其特征在于,所述中间标识指向被选取的用户标识的边权值为所述中间标识的排列值除以指向被选取的用户标识的所有中间标识的排列值之和;
所述中间标识指向所述同邻标识的边权值为所述中间标识的排列值除以指向所述同邻标识的所有终点标识的排列值之和。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710244245.2A CN108738036B (zh) | 2017-04-14 | 2017-04-14 | 移动通信的关键用户提取方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710244245.2A CN108738036B (zh) | 2017-04-14 | 2017-04-14 | 移动通信的关键用户提取方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108738036A CN108738036A (zh) | 2018-11-02 |
CN108738036B true CN108738036B (zh) | 2021-06-18 |
Family
ID=63924860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710244245.2A Active CN108738036B (zh) | 2017-04-14 | 2017-04-14 | 移动通信的关键用户提取方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108738036B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108738036B (zh) * | 2017-04-14 | 2021-06-18 | 广州杰赛科技股份有限公司 | 移动通信的关键用户提取方法和系统 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1482784A (zh) * | 2002-09-13 | 2004-03-17 | 华为技术有限公司 | 呼叫号码查找方法 |
CN1728147A (zh) * | 2004-05-14 | 2006-02-01 | 微软公司 | 基于异类关系确定目标相似性的方法和系统 |
CN1898664A (zh) * | 2003-09-24 | 2007-01-17 | 弗莱森信息录有限公司 | 信息分配系统 |
CN1980078A (zh) * | 2005-12-02 | 2007-06-13 | 大唐移动通信设备有限公司 | 多用户联合检测方法 |
CN101114370A (zh) * | 2007-08-21 | 2008-01-30 | 施侃晟 | 一种网络上的开放式全效传播与营销方法 |
CN101317173A (zh) * | 2004-09-29 | 2008-12-03 | 萨卡尔公司 | 用于通信和合作的系统 |
CN101729682A (zh) * | 2009-11-11 | 2010-06-09 | 南京联创科技集团股份有限公司 | 通信网络用户自动跟踪方法 |
CN101779180A (zh) * | 2007-08-08 | 2010-07-14 | 贝诺特公司 | 基于背景的内容推荐的方法和设备 |
CN103138981A (zh) * | 2011-11-30 | 2013-06-05 | 中国移动通信集团公司 | 一种社交网络分析方法和装置 |
CN104142950A (zh) * | 2013-05-10 | 2014-11-12 | 中国人民大学 | 基于关键词提取和基尼系数的微博用户分类方法 |
US8954106B2 (en) * | 2010-08-10 | 2015-02-10 | Samsung Electronics Co., Ltd. | Method and apparatus for configuring power headroom information in mobile communication system supporting carrier aggregation |
CN104507064A (zh) * | 2014-12-18 | 2015-04-08 | 苏州工业职业技术学院 | 基于PageRank算法的应急通讯话务优先排序方法 |
CN105744535A (zh) * | 2016-05-02 | 2016-07-06 | 北京联合大学 | 移动网络小区信息侦测与覆盖标定方法 |
CN105824813A (zh) * | 2015-01-05 | 2016-08-03 | 中国移动通信集团江苏有限公司 | 一种挖掘核心用户的方法及装置 |
CN108738036A (zh) * | 2017-04-14 | 2018-11-02 | 广州杰赛科技股份有限公司 | 移动通信的关键用户提取方法和系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8867451B2 (en) * | 2012-02-02 | 2014-10-21 | Andrew Llc | Optimized telecommunications distribution system |
US8976220B2 (en) * | 2013-07-05 | 2015-03-10 | Sorenson Communications, Inc. | Devices and methods for hosting a video call between a plurality of endpoints |
-
2017
- 2017-04-14 CN CN201710244245.2A patent/CN108738036B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1482784A (zh) * | 2002-09-13 | 2004-03-17 | 华为技术有限公司 | 呼叫号码查找方法 |
CN1898664A (zh) * | 2003-09-24 | 2007-01-17 | 弗莱森信息录有限公司 | 信息分配系统 |
CN1728147A (zh) * | 2004-05-14 | 2006-02-01 | 微软公司 | 基于异类关系确定目标相似性的方法和系统 |
CN101317173A (zh) * | 2004-09-29 | 2008-12-03 | 萨卡尔公司 | 用于通信和合作的系统 |
CN1980078A (zh) * | 2005-12-02 | 2007-06-13 | 大唐移动通信设备有限公司 | 多用户联合检测方法 |
CN101779180A (zh) * | 2007-08-08 | 2010-07-14 | 贝诺特公司 | 基于背景的内容推荐的方法和设备 |
CN101114370A (zh) * | 2007-08-21 | 2008-01-30 | 施侃晟 | 一种网络上的开放式全效传播与营销方法 |
CN101729682A (zh) * | 2009-11-11 | 2010-06-09 | 南京联创科技集团股份有限公司 | 通信网络用户自动跟踪方法 |
US8954106B2 (en) * | 2010-08-10 | 2015-02-10 | Samsung Electronics Co., Ltd. | Method and apparatus for configuring power headroom information in mobile communication system supporting carrier aggregation |
CN103138981A (zh) * | 2011-11-30 | 2013-06-05 | 中国移动通信集团公司 | 一种社交网络分析方法和装置 |
CN104142950A (zh) * | 2013-05-10 | 2014-11-12 | 中国人民大学 | 基于关键词提取和基尼系数的微博用户分类方法 |
CN104507064A (zh) * | 2014-12-18 | 2015-04-08 | 苏州工业职业技术学院 | 基于PageRank算法的应急通讯话务优先排序方法 |
CN105824813A (zh) * | 2015-01-05 | 2016-08-03 | 中国移动通信集团江苏有限公司 | 一种挖掘核心用户的方法及装置 |
CN105744535A (zh) * | 2016-05-02 | 2016-07-06 | 北京联合大学 | 移动网络小区信息侦测与覆盖标定方法 |
CN108738036A (zh) * | 2017-04-14 | 2018-11-02 | 广州杰赛科技股份有限公司 | 移动通信的关键用户提取方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108738036A (zh) | 2018-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106778876B (zh) | 基于移动用户轨迹相似性的用户分类方法和系统 | |
US9947060B2 (en) | Information matching and match validation | |
CN103077718B (zh) | 语音处理方法、系统和终端 | |
US8959072B2 (en) | Context-based multi-dimensional inquiring method of number address book | |
CN105824813B (zh) | 一种挖掘核心用户的方法及装置 | |
CN104066065B (zh) | 一种防骚扰来电/信息的移动终端及方法 | |
KR101561245B1 (ko) | 발신경로 정보 제공 방법 및 시스템 | |
KR101615406B1 (ko) | 서비스 선택 및 표시 방법 및 장치 | |
CN101821757A (zh) | 广告方法、sns广告系统以及记录介质 | |
CN102355534A (zh) | 移动终端和联系人信息推送方法 | |
CN103001994B (zh) | 好友推荐方法及装置 | |
KR101174213B1 (ko) | 인맥에 기초한 검색 결과 제공 시스템 및 방법 | |
KR101576941B1 (ko) | 발신경로 정보 제공 방법 및 시스템 | |
CN103279858A (zh) | 添加收件人的方法及其终端 | |
CN103190160A (zh) | 为移动通信用户提供电话目录服务的方法及系统 | |
KR20140135244A (ko) | 통계 정보 생성 시스템 및 통계 정보 생성 방법 | |
JPWO2016002133A1 (ja) | 予測システムおよび予測方法 | |
EP3537365A1 (en) | Method, device, and system for increasing users | |
CN104244223A (zh) | 一种联系人查询方法及装置 | |
CN108738036B (zh) | 移动通信的关键用户提取方法和系统 | |
CN106657545A (zh) | 拦截推送信息的方法、装置及终端 | |
Xu et al. | Using physical context in a mobile social networking application for improving friend recommendations | |
CN109388970A (zh) | 数据处理方法和装置 | |
CN103096360B (zh) | 获取wlan热点与核心网lac/ci的对应关系的方法及装置 | |
CN102208085A (zh) | 基于坐席系统获取用户喜好数据的方法及数据处理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |