CN108230173A - 用户关系圈的生成方法和装置、设备 - Google Patents
用户关系圈的生成方法和装置、设备 Download PDFInfo
- Publication number
- CN108230173A CN108230173A CN201810025346.5A CN201810025346A CN108230173A CN 108230173 A CN108230173 A CN 108230173A CN 201810025346 A CN201810025346 A CN 201810025346A CN 108230173 A CN108230173 A CN 108230173A
- Authority
- CN
- China
- Prior art keywords
- user
- factions
- customer relationship
- coefficient
- communications records
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004891 communication Methods 0.000 claims abstract description 167
- 238000004364 calculation method Methods 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 3
- 238000009412 basement excavation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005325 percolation Methods 0.000 description 2
- 230000018199 S phase Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种用户关系圈的生成方法和装置、设备。所述用户关系圈的生成方法包括:获得至少一个用户的用户通信记录;根据每个所述用户通信记录,获得至少一个第一用户派系;其中,每个所述第一用户派系中包含至少一个用户关系;根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数;将所述派系系数小于所述派系系数阈值的每个所述第一用户派系设置为第二用户派系;根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈。采用本发明,能够提高获得用户关系圈的速度和准确度。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种用户关系圈的生成方法和装置、设备。
背景技术
移动通信用户关系圈,指的是根据移动用户的通话关系特征、移动用户的行为特征等对移动用户进行社团划分而得的用户关系集合。这种基于用户特征的划分,能够帮助运营商更加了解用户关系网络的构成,为电信业务的拓展提供科学的支撑。
当前有不少成熟的社团划分算法:Palla等人于2005年首先提出了派系过滤算法CPM(Clique Percolation Method),该算法突破了传统的非重叠社团划分算法的限制,能够用来分析重叠的社团结构,其分析结果更贴近现实的社团结构。由于CPM的计算复杂度较大,Lancichinetti等人于2009年从网络局部结构的角度出发,提出了基于局部扩展思想的重叠社团挖掘算法(local fitness measure,LFM),提升了社团划分的速度。Evans和Ahn等人突破传统以网络节点为研究对象进行网络划分的局限,提出了边聚类的社团划分方法。Evans将网络结映射成为相应的线图后,可运用非重叠社团发现算法来进行重叠社团的划分。Ahn提出了基于边相似度的层次聚类算法来实现重叠社团的划分。
通过大量的研究和实践发现,当处理的移动用户数据的数量较为庞大时,上述算法运算所需要花费的时间十分漫长,无法满足大数据处理的需求。另外,上述算法大多只考虑了各个用户节点之间的连接关系,忽略各个用户节点之间的关系强弱,因此所得出的结果一般无法满足现实的社团划分需求。
发明内容
本发明实施例提出一种用户关系圈的生成方法和装置、设备,能够提高获得用户关系圈的速度和准确度。
本发明实施例提供的一种用户关系圈的生成方法,具体包括:
获得至少一个用户的用户通信记录;
根据每个所述用户通信记录,获得至少一个第一用户派系;其中,每个所述第一用户派系中包含至少一个用户关系;
根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数;
将所述派系系数小于所述派系系数阈值的每个所述第一用户派系设置为第二用户派系;
根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈。
进一步地,每个所述用户对应的用户通信记录的总个数均大于2个。
进一步地,所述根据每个所述用户通信记录,获得至少一个第一用户派系,具体包括:
生成每个所述用户通信记录对应的用户关系;
根据每个所述用户通信记录,获得频率系数阈值和每个所述用户关系对应的频率系数;
将所述频率系数不小于所述频率系数阈值的每个所述用户关系设置为目标用户关系;
根据每个所述目标用户关系,获得至少一个所述第一用户派系。
进一步地,每个所述用户通信记录中包含通信频率;
则所述根据每个所述用户通信记录,获得频率系数阈值和每个所述用户关系对应的频率系数,具体包括:
根据每个所述用户通信记录uv中的通信频率tfuv和预设的频率系数计算模型CFuv=tfuv×idfuv,计算获得每个所述用户关系对应的频率系数CFuv;其中,idfuv为所述用户通信记录uv的通信逆频率;
根据每个所述频率系数CFuv和预设的频率系数阈值计算模型计算获得所述频率系数阈值I(C);其中,d(u)为用户u对应的用户通信记录uv的总个数。
进一步地,所述根据每个所述用户通信记录,获得至少一个第一用户派系,具体包括:
生成每个所述用户通信记录对应的用户关系,获得由所有所述用户关系组成的用户关系集合;
将所述用户关系集合中的任意一个用户关系作为当前用户关系;
获得所述当前用户关系对应的g-n派系,并将所述g-n派系中的用户关系从所述用户关系集合中删除;其中,1≤n≤g;
将所述用户关系集合中的剩余的任意一个用户关系作为新的当前用户关系,并进一步获得所述新的当前用户关系对应的g-n派系,直至将所有所述用户关系从所述用户关系集合中删除;
根据每个所述用户通信记录,生成新的用户关系集合,并在调整获得新的n值后,进一步根据所述新的用户关系集合和所述新的n值,获得至少一个新的g-n派系,直至所述n值达到预设阈值;
将每个所述g-n派系设置为所述第一用户派系。
进一步地,每个所述用户通信记录uv中包含用户u和用户v的至少一个通信记录;每个所述通信记录中包含通信时刻和通信时长;每个所述用户通信记录uv中的通信记录按照所述通信时刻的先后顺序排列;
则在所述获得至少一个用户的用户通信记录之后,所述根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数之前,还包括:
生成每个所述用户通信记录uv对应的用户关系;
根据每个所述用户通信记录uv和预设的用户关系权重计算模型计算获得每个所述用户关系对应的用户关系权重wuv;其中,n为所述用户通信记录uv中的通信记录的总个数;γ和α为常数;tuv_k为所述用户通信记录uv中的第k个通信记录中的通信时长;tu为用户u对应的所有通信记录的通信总时长;tv为用户v对应的所有通信记录的通信总时长。
进一步地,所述根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数,具体包括:
根据每个所述用户关系的用户关系权重和预设的派系系数计算模型计算获得每个所述第一用户派系uv的派系系数c.vuv;其中,σuv为所述第一用户派系uv中的所有用户关系的用户关系权重的标准差;μuv为所述第一用户派系uv中的所有用户关系的用户关系权重的平均值;
根据每个所述派系系数c.vuv和预设的派系系数阈值计算模型计算获得所述派系系数阈值C.V*;其中,m为所有所述第一用户派系的总个数。
进一步地,所述根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈,具体包括:
根据所有所述第二用户派系,生成用户派系重叠矩阵;
根据预设的z值对所述用户派系重叠矩阵进行社团划分,获得派系社团;
将所述派系社团设置为所述用户关系圈。
相应地,本发明实施例还提供了一种用户关系圈的生成装置,具体包括:
用户通信记录获得模块,用于获得至少一个用户的用户通信记录;
第一用户派系获得模块,用于根据每个所述用户通信记录,获得至少一个第一用户派系;其中,每个所述第一用户派系中包含至少一个用户关系;
派系系数计算获得模块,用于根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数;
第二用户派系获得模块,用于将所述派系系数小于所述派系系数阈值的每个所述第一用户派系设置为第二用户派系;以及,
用户关系圈生成模块,用于根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈。
本发明实施例还提供了一种设备,具体包括至少一个存储器以及至少一个处理器;
所述存储器,包括存储于其中的至少一个可执行程序;
所述可执行程序在由所述处理器执行时,使得所述处理器实现如上所述的用户关系圈的生成方法。
实施本发明实施例,具有如下有益效果:
本发明实施例提供的用户关系圈的生成方法和装置、设备,通过根据用户通信记录对用户进行派系划分,并通过根据用户关系权重将其中用户关系较为疏松的用户派系过滤掉,从而能够在减少数据计算量的同时,考虑各个用户关系的联系强弱,因此能够在大大提高获得用户关系圈的速度的同时,获得接近实际情况的用户关系圈,提高所获得的用户关系圈的准确度。
附图说明
图1是本发明提供的用户关系圈的生成方法的一个优选的实施例的流程示意图;
图2是本发明提供的用户关系圈的生成装置的一个优选的实施例的结构示意图;
图3是本发明提供的设备的一个优选的实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明提供的用户关系圈的生成方法的一个优选的实施例的流程示意图,包括步骤S11至S15,具体如下:
S11:获得至少一个用户的用户通信记录。
需要说明的是,本发明实施例由系统执行。其中,该系统可以为服务器中的系统,也可以为任意设备中的系统,在此不作限定。
本实施例根据用户的用户通信记录,从中挖掘出接近真实情况的用户关系圈。因此,系统在接收到触发指令之后,从运营商中获取一个或者多个用户的用户通信记录,并对这些用户通信记录进行分析。在本实施例中,每个用户通信记录中包含一个用户和另一个用户的所有通信记录,例如,用户通信记录uv中包含用户u和用户v每次通信的通信记录。
S12:根据每个所述用户通信记录,获得至少一个第一用户派系;其中,每个所述第一用户派系中包含至少一个用户关系。
需要说明的是,系统在获得一个或者多个用户的用户通信记录之后,对这些用户通信记录进行分析,生成相应的用户关系,并通过对这些用户关系进行划分,从而获得一个或者多个第一用户派系。
S13:根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数。
需要说明的是,在本实施例中,每个用户关系具有对应的用户关系权重。根据每个用户关系的用户关系权重,可以计算获得派系系数阈值以及其所在的用户派系的派系系数。其中,派系系数用于表示用户派系中的各个用户关系的紧密程度。
S14:将所述派系系数小于所述派系系数阈值的每个所述第一用户派系设置为第二用户派系。
需要说明的是,根据计算获得的派系系数阈值以及每个第一用户派系的派系系数,可以将其中用户关系的紧密程度较弱的用户派系过滤掉,从而获得用户关系较为紧密的一个或者多个第二用户派系。
S15:根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈。
需要说明的是,系统在获得一个或者多个第二用户派系之后,对这些第二用户派系进行分析,从而获得相应的用户关系圈。
本发明实施例通过根据用户通信记录对用户进行派系划分,并通过根据用户关系权重将其中用户关系较为疏松的用户派系过滤掉,从而能够在减少数据计算量的同时,考虑各个用户关系的联系强弱,因此能够在大大提高获得用户关系圈的速度的同时,获得接近实际情况的用户关系圈,提高所获得的用户关系圈的准确度。
在另一个优选的实施例中,每个所述用户对应的用户通信记录的总个数均大于2个。
需要说明的是,系统在获得各个用户通信记录之后,将各个用户作为网络节点,各个用户通信记录作为各个网络节点之间的连接(即用户关系),从而获得对应的用户通信网络。在本实施例中,为了进一步减少数据计算量,还可以将该用户通信网络中的度数小于或者等于2的网络节点删除,从而基于度数大于2的网络节点进行后续的用户关系圈的挖掘。
在又一个优选的实施例中,上述步骤S12可以进一步包括子步骤S1211至S1214,具体如下:
S1211:生成每个所述用户通信记录对应的用户关系。
需要说明的是,系统在获得各个用户通信记录之后,将各个用户作为网络节点,各个用户通信记录作为各个网络节点之间的连接(即用户关系),从而获得对应的用户通信网络。
S1212:根据每个所述用户通信记录,获得频率系数阈值和每个所述用户关系对应的频率系数。
需要说明的是,本实施例通过计算每个用户关系的频率系数来对每个用户关系的重要性进行评价。
进一步地,每个所述用户通信记录中包含通信频率。
则上述子步骤S1212还可以进一步包括步骤S1212_1至S1212_2,具体如下:
S1212_1:根据每个所述用户通信记录uv中的通信频率tfuv和预设的频率系数计算模型CFuv=tfuv×idfuv,计算获得每个所述用户关系对应的频率系数CFuv;其中,idfuv为所述用户通信记录uv的通信逆频率。
S1212_2:根据每个所述频率系数CFuv和预设的频率系数阈值计算模型计算获得所述频率系数阈值I(C);其中,d(u)为用户u对应的用户通信记录uv的总个数。
需要说明的是,在一些具体的实施例中,还可以通过采用TF-IDF(termfrequency–inverse document frequency)算法来计算每个用户关系的频率系数。
S1213:将所述频率系数不小于所述频率系数阈值的每个所述用户关系设置为目标用户关系。
需要说明的是,若用户关系的频率系数小于上述频率系数阈值,则认为该用户关系的发生频率较小,可能为与公共电话、推销电话等相关的用户关系,在挖掘用户关系圈的过程中不予考虑,因此将该用户关系以及对应的用户删除;与之相反,若用户关系的频率系数大于或者等于上述频率系数阈值,则认为该用户关系的发生频率较高,为重要的用户关系,因此将该用户关系设置为目标用户关系,以用于进行后续的用户关系圈的挖掘。
S1214:根据每个所述目标用户关系,获得至少一个所述第一用户派系。
在又一个优选的实施例中,上述步骤S12还可以进一步包括子步骤S1221至S1226,具体如下:
S1221:生成每个所述用户通信记录对应的用户关系,获得由所有所述用户关系组成的用户关系集合。
需要说明的是,系统在获得各个用户通信记录之后,将各个用户作为网络节点,各个用户通信记录作为各个网络节点之间的连接(即用户关系),从而获得对应的用户通信网络(即用户关系集合)。
S1222:将所述用户关系集合中的任意一个用户关系作为当前用户关系。
S1223:获得所述当前用户关系对应的g-n派系,并将所述g-n派系中的用户关系从所述用户关系集合中删除;其中,1≤n≤g。
S1224:将所述用户关系集合中的剩余的任意一个用户关系作为新的当前用户关系,并进一步获得所述新的当前用户关系对应的g-n派系,直至将所有所述用户关系从所述用户关系集合中删除。
S1225:根据每个所述用户通信记录,生成新的用户关系集合,并在调整获得新的n值后,进一步根据所述新的用户关系集合和所述新的n值,获得至少一个新的g-n派系,直至所述n值达到预设阈值。
需要说明的是,在本实施例中,依次从上述用户通信网络中挖掘获得g-1派系、g-2派系,……,g-n派系。具体地,当n=1时,在上述用户通信网络中随机选取一个网络节点作为基准点,并在该用户通信网络中搜寻包含该网络节点的大小为g-1的g-1派系,在获得该g-1派系之后,将该g-1派系中包含的用户关系和网络节点从上述用户通信网络中删除;随后,将该用户通信网络中剩余的网络节点中随机选取一个网络节点作为新的基准点,并按照相同的方法获得包含该网络节点的g-1派系;依次类推,获得上述用户通信网络中的所有g-1派系,直至该用户通信网络中的所有用户关系和网络节点均被删除。按照相同的方法,当n=2、n=3,……,n=n时,分别获得对应的g-2派系、g-3派系,……,g-n派系。
S1226:将每个所述g-n派系设置为所述第一用户派系。
在又一个优选的实施例中,每个所述用户通信记录uv中包含用户u和用户v的至少一个通信记录;每个所述通信记录中包含通信时刻和通信时长;每个所述用户通信记录uv中的通信记录按照所述通信时刻的先后顺序排列。
则在上述步骤S11之后,步骤S13之前,还包括步骤S16至S17,具体如下:
S16:生成每个所述用户通信记录uv对应的用户关系。
S17:根据每个所述用户通信记录uv和预设的用户关系权重计算模型计算获得每个所述用户关系对应的用户关系权重wuv;其中,n为所述用户通信记录uv中的通信记录的总个数;γ和α为常数;tuv_k为所述用户通信记录uv中的第k个通信记录中的通信时长;tu为用户u对应的所有通信记录的通信总时长;tv为用户v对应的所有通信记录的通信总时长。
需要说明的是,在本实施例中,通过引入通信时刻先后的概念,从而在计算用户关系权重的过程中考虑用户通信时刻的影响,即,通信时刻越靠前越久远的通信记录对用户关系权重的影响越小,通信时刻越靠后越接近当前时刻的通信记录对用户关系权重的影响越大,从而能够使得计算获得的用户关系权重更加符合实际情况,进一步提高所获得的用户关系圈的准确度。
在又一个优选的实施例中,上述步骤S13还可以进一步包括子步骤S1301至S1302,具体如下:
S1301:根据每个所述用户关系的用户关系权重和预设的派系系数计算模型计算获得每个所述第一用户派系uv的派系系数c.vuv;其中,σuv为所述第一用户派系uv中的所有用户关系的用户关系权重的标准差;μuv为所述第一用户派系uv中的所有用户关系的用户关系权重的平均值。
S1302:根据每个所述派系系数c.vuv和预设的派系系数阈值计算模型计算获得所述派系系数阈值C.V*;其中,m为所有所述第一用户派系的总个数。
需要说明的是,一般来说,一个用户派系中的各个用户关系的用户关系权重的差别越大,则表明该用户派系中的各个用户之间的紧密程度越低,用户关系的关联强度越低;与之相反,一个用户派系中的各个用户关系的用户关系权重的差别越小,则表明该用户派系中的各个用户之间的紧密程度越高,用户关系的关联强度越高。在本实施例中,为了在客观评定一个用户派系中的各个用户关系的关联强度的同时,消除大数据可能会带来的数据浮动带来的影响,因此通过根据用户关系权重的标准差和用户关系权重的平均值计算获得各个第一用户派系的派系系数,并根据该派系系数来对第一用户派系的用户关系强度进行评价,从而将其中用户关系的关联强度较弱的第一用户派系过滤掉,获得其中用户关系的关联强度较强的第一用户派系。
在又一个优选的实施例中,上述步骤S15还可以进一步包括子步骤S1501至S1503,具体如下:
S1501:根据所有所述第二用户派系,生成用户派系重叠矩阵。
S1502:根据预设的z值对所述用户派系重叠矩阵进行社团划分,获得派系社团。
需要说明的是,在一些具体的实施例中,系统在获得用户派系重叠矩阵之后,根据该用户派系重叠矩阵和与预先输入的z值,构建用户派系连接矩阵,并基于该用户派系连接矩阵进行社团划分,从而获得上述派系社团。
S1503:将所述派系社团设置为所述用户关系圈。
需要说明的是,在一些具体的实施例中,还可以对该派系社团进行评价。具体地,该评价公式为:其中,M表示上述用户通信网络中的所有用户关系的用户关系权重之和;oi和oj分别表示网络节点i和网络节点j所述的派系社团的个数;Wi.表示网络节点i相关的所有用户关系的用户关系权重之和;Wj.表示网络节点j相关的所有用户关系的用户关系权重之和;当网络节点i和网络节点j属于同一用户派系时,σ(ci,cj)=1;当网络节点i和网络节点j不属于同一用户派系时,σ(ci,cj)=0。
需要进一步说明的是,上述各个实施例中的步骤标号仅用于表示不同的步骤,而不对各个步骤之间的执行顺序进行限定。
本发明实施例提供的用户关系圈的生成方法,通过根据用户通信记录对用户进行派系划分,并通过根据用户关系权重将其中用户关系较为疏松的用户派系过滤掉,从而能够在减少数据计算量的同时,考虑各个用户关系的联系强弱,因此能够在大大提高获得用户关系圈的速度的同时,获得接近实际情况的用户关系圈,提高所获得的用户关系圈的准确度。
相应地,本发明还提供一种用户关系圈的生成装置,能够实现上述实施例中的用户关系圈的生成方法的所有流程。
如图2所示,为本发明提供的用户关系圈的生成装置的一个优选的实施例的结构示意图,具体如下:
用户通信记录获得模块21,用于获得至少一个用户的用户通信记录;
第一用户派系获得模块22,用于根据每个所述用户通信记录,获得至少一个第一用户派系;其中,每个所述第一用户派系中包含至少一个用户关系;
派系系数计算获得模块23,用于根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数;
第二用户派系获得模块24,用于将所述派系系数小于所述派系系数阈值的每个所述第一用户派系设置为第二用户派系;以及,
用户关系圈生成模块25,用于根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈。
进一步地,每个所述用户对应的用户通信记录的总个数均大于2个。
进一步地,所述第一用户派系获得模块,具体包括:
用户关系生成单元,用于生成每个所述用户通信记录对应的用户关系;
频率系数计算单元,用于根据每个所述用户通信记录,获得频率系数阈值和每个所述用户关系对应的频率系数;
目标用户关系获得单元,用于将所述频率系数不小于所述频率系数阈值的每个所述用户关系设置为目标用户关系;以及,
第一用户派系生成单元,用于根据每个所述目标用户关系,获得至少一个所述第一用户派系。
进一步地,每个所述用户通信记录中包含通信频率;
则所述频率系数计算单元,具体包括:
频率系数计算子单元,用于根据每个所述用户通信记录uv中的通信频率tfuv和预设的频率系数计算模型CFuv=tfuv×idfuv,计算获得每个所述用户关系对应的频率系数CFuv;其中,idfuv为所述用户通信记录uv的通信逆频率;以及,
频率系数阈值计算子单元,用于根据每个所述频率系数CFuv和预设的频率系数阈值计算模型计算获得所述频率系数阈值I(C);其中,d(u)为用户u对应的用户通信记录uv的总个数。
进一步地,所述第一用户派系获得模块,具体包括:
用户关系集合获得单元,用于生成每个所述用户通信记录对应的用户关系,获得由所有所述用户关系组成的用户关系集合;
当前用户关系设置单元,用于将所述用户关系集合中的任意一个用户关系作为当前用户关系;
g-n派系获得单元,用于获得所述当前用户关系对应的g-n派系,并将所述g-n派系中的用户关系从所述用户关系集合中删除;其中,1≤n≤g;
第一循环单元,用于将所述用户关系集合中的剩余的任意一个用户关系作为新的当前用户关系,并进一步获得所述新的当前用户关系对应的g-n派系,直至将所有所述用户关系从所述用户关系集合中删除;
第二循环单元,用于根据每个所述用户通信记录,生成新的用户关系集合,并在调整获得新的n值后,进一步根据所述新的用户关系集合和所述新的n值,获得至少一个新的g-n派系,直至所述n值达到预设阈值;以及,
第一用户派系获得单元,用于将每个所述g-n派系设置为所述第一用户派系。
进一步地,每个所述用户通信记录uv中包含用户u和用户v的至少一个通信记录;每个所述通信记录中包含通信时刻和通信时长;每个所述用户通信记录uv中的通信记录按照所述通信时刻的先后顺序排列;
则所述用户关系圈的生成装置,还包括:
用户关系生成单元,用于生成每个所述用户通信记录uv对应的用户关系;以及,
用户关系权重计算单元,用于根据每个所述用户通信记录uv和预设的用户关系权重计算模型计算获得每个所述用户关系对应的用户关系权重wuv;其中,n为所述用户通信记录uv中的通信记录的总个数;γ和α为常数;tuv_k为所述用户通信记录uv中的第k个通信记录中的通信时长;tu为用户u对应的所有通信记录的通信总时长;tv为用户v对应的所有通信记录的通信总时长。
进一步地,所述派系系数计算获得模块,具体包括:
派系系数计算单元,用于根据每个所述用户关系的用户关系权重和预设的派系系数计算模型计算获得每个所述第一用户派系uv的派系系数c.vuv;其中,σuv为所述第一用户派系uv中的所有用户关系的用户关系权重的标准差;μuv为所述第一用户派系uv中的所有用户关系的用户关系权重的平均值;以及,
派系系数阈值计算单元,用于根据每个所述派系系数c.vuv和预设的派系系数阈值计算模型计算获得所述派系系数阈值C.V*;其中,m为所有所述第一用户派系的总个数。
进一步地,所述用户关系圈生成模块,具体包括:
用户派系重叠矩阵生成单元,用于根据所有所述第二用户派系,生成用户派系重叠矩阵;
派系社团获得单元,用于根据预设的z值对所述用户派系重叠矩阵进行社团划分,获得派系社团;以及,
用户关系圈获得单元,用于将所述派系社团设置为所述用户关系圈。
本发明实施例提供的用户关系圈的生成装置,通过根据用户通信记录对用户进行派系划分,并通过根据用户关系权重将其中用户关系较为疏松的用户派系过滤掉,从而能够在减少数据计算量的同时,考虑各个用户关系的联系强弱,因此能够在大大提高获得用户关系圈的速度的同时,获得接近实际情况的用户关系圈,提高所获得的用户关系圈的准确度。
本发明还提供了一种设备。
如图3所示,为本发明提供的设备的一个优选的实施例的结构示意图,具体包括至少一个存储器31以及至少一个处理器32;
所述存储器31,包括存储于其中的至少一个可执行程序;
所述可执行程序在由所述处理器32执行时,使得所述处理器32实现如上任一实施例所述的用户关系圈的生成方法。
需要说明的是,图3仅以该设备中的一个存储器和一个处理器相连接为例进行示意,在一些具体的实施例中,该设备中还可以包括多个存储器和/或多个处理器,其具体的数目及连接方式可根据实际情况需要进行设置和适应性调整。
本发明实施例提供的设备,通过根据用户通信记录对用户进行派系划分,并通过根据用户关系权重将其中用户关系较为疏松的用户派系过滤掉,从而能够在减少数据计算量的同时,考虑各个用户关系的联系强弱,因此能够在大大提高获得用户关系圈的速度的同时,获得接近实际情况的用户关系圈,提高所获得的用户关系圈的准确度。
本发明还提供了一种计算机可读存储介质,具体包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任一实施例所述的用户关系圈的生成方法。
需要说明的是,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要进一步说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
本发明实施例提供的计算机可读存储介质,通过根据用户通信记录对用户进行派系划分,并通过根据用户关系权重将其中用户关系较为疏松的用户派系过滤掉,从而能够在减少数据计算量的同时,考虑各个用户关系的联系强弱,因此能够在大大提高获得用户关系圈的速度的同时,获得接近实际情况的用户关系圈,提高所获得的用户关系圈的准确度。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种用户关系圈的生成方法,其特征在于,包括:
获得至少一个用户的用户通信记录;
根据每个所述用户通信记录,获得至少一个第一用户派系;其中,每个所述第一用户派系中包含至少一个用户关系;
根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数;
将所述派系系数小于所述派系系数阈值的每个所述第一用户派系设置为第二用户派系;
根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈。
2.如权利要求1所述的用户关系圈的生成方法,其特征在于,每个所述用户对应的用户通信记录的总个数均大于2个。
3.如权利要求1所述的用户关系圈的生成方法,其特征在于,所述根据每个所述用户通信记录,获得至少一个第一用户派系,具体包括:
生成每个所述用户通信记录对应的用户关系;
根据每个所述用户通信记录,获得频率系数阈值和每个所述用户关系对应的频率系数;
将所述频率系数不小于所述频率系数阈值的每个所述用户关系设置为目标用户关系;
根据每个所述目标用户关系,获得至少一个所述第一用户派系。
4.如权利要求3所述的用户关系圈的生成方法,其特征在于,每个所述用户通信记录中包含通信频率;
则所述根据每个所述用户通信记录,获得频率系数阈值和每个所述用户关系对应的频率系数,具体包括:
根据每个所述用户通信记录uv中的通信频率tfuv和预设的频率系数计算模型CFuv=tfuv×idfuv,计算获得每个所述用户关系对应的频率系数CFuv;其中,idfuv为所述用户通信记录uv的通信逆频率;
根据每个所述频率系数CFuv和预设的频率系数阈值计算模型计算获得所述频率系数阈值I(C);其中,d(u)为用户u对应的用户通信记录uv的总个数。
5.如权利要求1所述的用户关系圈的生成方法,其特征在于,所述根据每个所述用户通信记录,获得至少一个第一用户派系,具体包括:
生成每个所述用户通信记录对应的用户关系,获得由所有所述用户关系组成的用户关系集合;
将所述用户关系集合中的任意一个用户关系作为当前用户关系;
获得所述当前用户关系对应的g-n派系,并将所述g-n派系中的用户关系从所述用户关系集合中删除;其中,1≤n≤g;
将所述用户关系集合中的剩余的任意一个用户关系作为新的当前用户关系,并进一步获得所述新的当前用户关系对应的g-n派系,直至将所有所述用户关系从所述用户关系集合中删除;
根据每个所述用户通信记录,生成新的用户关系集合,并在调整获得新的n值后,进一步根据所述新的用户关系集合和所述新的n值,获得至少一个新的g-n派系,直至所述n值达到预设阈值;
将每个所述g-n派系设置为所述第一用户派系。
6.如权利要求1所述的用户关系圈的生成方法,其特征在于,每个所述用户通信记录uv中包含用户u和用户v的至少一个通信记录;每个所述通信记录中包含通信时刻和通信时长;每个所述用户通信记录uv中的通信记录按照所述通信时刻的先后顺序排列;
则在所述获得至少一个用户的用户通信记录之后,所述根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数之前,还包括:
生成每个所述用户通信记录uv对应的用户关系;
根据每个所述用户通信记录uv和预设的用户关系权重计算模型计算获得每个所述用户关系对应的用户关系权重wuv;其中,n为所述用户通信记录uv中的通信记录的总个数;γ和α为常数;tuv_k为所述用户通信记录uv中的第k个通信记录中的通信时长;tu为用户u对应的所有通信记录的通信总时长;tv为用户v对应的所有通信记录的通信总时长。
7.如权利要求1所述的用户关系圈的生成方法,其特征在于,所述根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数,具体包括:
根据每个所述用户关系的用户关系权重和预设的派系系数计算模型计算获得每个所述第一用户派系uv的派系系数c.vuv;其中,σuv为所述第一用户派系uv中的所有用户关系的用户关系权重的标准差;μuv为所述第一用户派系uv中的所有用户关系的用户关系权重的平均值;
根据每个所述派系系数c.vuv和预设的派系系数阈值计算模型计算获得所述派系系数阈值C.V*;其中,m为所有所述第一用户派系的总个数。
8.如权利要求1所述的用户关系圈的生成方法,其特征在于,所述根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈,具体包括:
根据所有所述第二用户派系,生成用户派系重叠矩阵;
根据预设的z值对所述用户派系重叠矩阵进行社团划分,获得派系社团;
将所述派系社团设置为所述用户关系圈。
9.一种用户关系圈的生成装置,其特征在于,包括:
用户通信记录获得模块,用于获得至少一个用户的用户通信记录;
第一用户派系获得模块,用于根据每个所述用户通信记录,获得至少一个第一用户派系;其中,每个所述第一用户派系中包含至少一个用户关系;
派系系数计算获得模块,用于根据每个所述用户关系的用户关系权重,获得派系系数阈值和每个所述第一用户派系的派系系数;
第二用户派系获得模块,用于将所述派系系数小于所述派系系数阈值的每个所述第一用户派系设置为第二用户派系;以及,
用户关系圈生成模块,用于根据所有所述第二用户派系,生成与所有所述用户相对应的用户关系圈。
10.一种设备,其特征在于,包括至少一个存储器以及至少一个处理器;
所述存储器,包括存储于其中的至少一个可执行程序;
所述可执行程序在由所述处理器执行时,使得所述处理器实现如权利要求1至8中任一项所述的用户关系圈的生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810025346.5A CN108230173A (zh) | 2018-01-09 | 2018-01-09 | 用户关系圈的生成方法和装置、设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810025346.5A CN108230173A (zh) | 2018-01-09 | 2018-01-09 | 用户关系圈的生成方法和装置、设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108230173A true CN108230173A (zh) | 2018-06-29 |
Family
ID=62640896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810025346.5A Pending CN108230173A (zh) | 2018-01-09 | 2018-01-09 | 用户关系圈的生成方法和装置、设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108230173A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199836A (zh) * | 2014-08-04 | 2014-12-10 | 浙江工商大学 | 一种基于子兴趣划分的标注用户模型建构方法 |
US20150135261A1 (en) * | 2013-07-10 | 2015-05-14 | Board Of Regents Of The University Of Texas System | Relationship based information sharing control system and method of use |
CN105592405A (zh) * | 2015-10-30 | 2016-05-18 | 东北大学 | 基于派系过滤和标签传播的移动通信用户群组构造方法 |
-
2018
- 2018-01-09 CN CN201810025346.5A patent/CN108230173A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150135261A1 (en) * | 2013-07-10 | 2015-05-14 | Board Of Regents Of The University Of Texas System | Relationship based information sharing control system and method of use |
CN104199836A (zh) * | 2014-08-04 | 2014-12-10 | 浙江工商大学 | 一种基于子兴趣划分的标注用户模型建构方法 |
CN105592405A (zh) * | 2015-10-30 | 2016-05-18 | 东北大学 | 基于派系过滤和标签传播的移动通信用户群组构造方法 |
Non-Patent Citations (4)
Title |
---|
YI-JEN SU等: "Paper Classification by Topic Grouping in Citation Networks", 《2012 INTERNATIONAL CONFERENCE ON COMPUTING, MEASUREMENT, CONTROL AND SENSOR NETWORK》 * |
刘韩旭等: "基于改进派系过滤算法的用户通信模型的分群方法 ", 《电子技术》 * |
吕明玲: "基于通话记录和短信记录的关系圈挖掘", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
梁新荣: "实时变化的移动社区挖掘算法的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4979207A (en) | Method of processing cellular telephone call detail data for billing multi-line customers for cellular telephone services | |
CN106204106A (zh) | 一种特定用户识别方法及系统 | |
Bellhouse et al. | Systematic sampling in the presence of a trend | |
EP1711025A3 (en) | An Apparatus And Method For Processing Information From A Telephone Network | |
CN104484282A (zh) | 一种内存回收方法和装置 | |
CN107517394A (zh) | 识别非法用户的方法、装置及计算机可读存储介质 | |
CN108307068A (zh) | 副屏显示界面切换方法、移动终端及存储介质 | |
CN107491674A (zh) | 基于特征信息进行用户验证的方法及装置 | |
CN108764951A (zh) | 用户相似度获得方法和装置、设备、存储介质 | |
CN103577660A (zh) | 灰度实验系统和方法 | |
CN110247796A (zh) | 监控告警方法、装置及相关设备 | |
CN106875185A (zh) | 一种风控模型训练方法及装置 | |
CN106919576A (zh) | 利用二级类目下的关键词库搜索应用程序的方法及装置 | |
CN108230173A (zh) | 用户关系圈的生成方法和装置、设备 | |
CN111988749B (zh) | 一种动态资费的生成方法及装置 | |
CN106919587A (zh) | 应用程序搜索系统及方法 | |
CN106485521A (zh) | 用户信用度评估方法及装置 | |
CN116402482B (zh) | 基于电费智能结算的数据处理方法及处理设备 | |
CN108600961A (zh) | 用户相似度的获得方法和装置、设备、存储介质 | |
CN108804670A (zh) | 数据推荐方法、装置、计算机设备和存储介质 | |
CN105955478A (zh) | 视频信息支付方法及装置 | |
CN106027303A (zh) | 一种征信特征获取方法及其设备 | |
CN109785155A (zh) | 基于医保报销模型调整医保策略的方法及相关产品 | |
CN1322706C (zh) | 一种实时分段计费的方法 | |
CN109697224A (zh) | 一种账单消息处理方法、装置和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180629 |