CN106204060A

CN106204060A - 通过计算机系统实现的将用户划分至集群的方法及装置

Info

Publication number: CN106204060A
Application number: CN201610490107.8A
Authority: CN
Inventors: 黄引刚
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2016-06-28
Filing date: 2016-06-28
Publication date: 2016-12-07
Anticipated expiration: 2036-06-28
Also published as: CN106204060B

Abstract

本发明公开了一种通过计算机系统实现的将用户划分至集群的方法及装置，属于计算机技术领域。所述方法包括：计算机系统获取用户的好友用户；对于任一集群，计算机系统获取各个好友用户判定用户属于该集群的判定结果；计算机系统根据判定结果、各个好友用户的可信度以及好友用户的参考数量，计算用户分别属于各个集群的概率，将得到的各个概率记为第一类概率；计算机系统将用户划分至得到的第一类概率中最大概率所对应的集群。本发明解决了相关技术中通常是由用户自行选择属于的集群的集群划分方法准确率较低，且带有用户的主观性的问题；达到了准确的判断出用户属于的集群，为用户提供与该集群相应的服务，更好的满足用户的需求的效果。

Description

通过计算机系统实现的将用户划分至集群的方法及装置

技术领域

本发明涉及计算机技术领域，特别涉及一种将用户划分至集群的方法及装置。

背景技术

集群是指由将相似特征的用户构成的群体，在征信项目中，集群划分是风险控制中重要的一环。

集群通常分为高风险集群、高征信集群。高风险集群是指信用不达标、经济条件不达标或不稳定的集群，而高征信集群是指信用达标、经济条件达标或稳定的集群。

准确的判断出用户属于的集群，为用户提供与该集群相应的服务，可以更好的满足用户的需求。

发明内容

本发明实施例提供了一种通过计算机系统实现的将用户划分至集群的方法及装置。所述技术方案如下：

第一方面，提供了一种通过计算机系统实现的将用户划分至集群的方法，所述方法包括：计算机系统获取所述用户的好友用户；对于任一集群，所述计算机系统获取各个好友用户判定所述用户属于所述集群的判定结果，每个判定结果用于指示每个好友用户判定所述用户是否属于所述集群；所述计算机系统根据所述判定结果、各个好友用户的可信度以及好友用户的参考数量，计算所述用户分别属于各个集群的概率，将得到的各个所述概率记为第一类概率；所述计算机系统将所述用户划分至所述得到的第一类概率中最大概率所对应的集群。由于用户所属某一集群的第一类概率与该用户的各个好友用户判定用户属于各个集群的判定结果、各个好友用户的可信度以及好友用户的参考数量相关；因此解决了相关技术中通常是由用户自行选择属于的集群的集群划分方法准确率较低，且带有用户的主观性的问题；达到了准确的判断出用户属于的集群，为用户提供与该集群相应的服务，更好的满足用户的需求的效果。

可选的，在所述得到的各个所述概率记为第一类概率之后，所述方法还包括：在所述用户已经加入了至少一个群组时，所述计算机系统计算所述用户所加入的群组分别属于各个集群的概率；对于任一群组，所述计算机系统确定出所述群组所属的各个集群中概率最大的集群，将所述群组划分至所述集群中。

可选的，在所述将所述群组划分至所述集群中之后，所述方法还包括：对于任一集群，所述计算机系统计算被划分至所述集群的群组属于所述集群的概率的平均值；所述计算机系统将各个集群所对应的平均值组成第二类概率；所述计算机系统利用所述第二类概率对所述第一类概率进行修正，得到所述用户分别属于各个集群的修正后的第一类概率；所述计算机系统确定出所述修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。

可选的，所述计算机系统确定出所述修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中，包括：所述计算机系统执行所述计算所述用户所加入群组分别属于各个集群的概率的步骤，直至得到的修正后的第一类概率符合迭代终止条件；所述计算机系统确定出最后得到的修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。通过迭代计算，不断利用该第二类概率对第一类概率进行修正，使得修正后的第一类概率更为精准。

可选的，所述计算机系统根据所述判定结果、各个好友用户的可信度以及好友用户的参考数量，计算所述用户分别属于各个集群的概率，包括：对于任一个集群，所述计算机系统将判定所述用户属于所述集群的各个好友用户的可信度进行累加，得到好友用户判定所述用户属于所述集群的权重；所述计算机系统将所述集群的权重除以各个集群的权重之和，得到所述集群的相对强度；所述计算机系统按照与所述集群的权重相关的计算公式，计算所述集群的证据支撑度；所述计算机系统将所述集群的相对强度乘以所述集群的证据支撑度，得到所述用户属于所述集群的概率；其中，所述计算公式为：所述λ_i为第i个集群的证据支撑度，所述T为所述好友用户的参考数量，T≤n，n为所述用户的好友用户的总数量，所述ω(i)为好友用户判定所述用户属于所述第i个集群的权重。

可选的，所述所述计算机系统计算所述用户所加入的群组分别属于各个集群的概率，包括：对于所述用户加入的每个群组，所述计算机系统获取所述群组内各个群成员属于各个集群的概率；对于任一集群，所述计算机系统计算各个群成员属于所述集群的概率的平均值，将所述平均值记为所述群组属于所述集群的概率。

可选的，所述对于任一集群，所述计算机系统计算被划分至所述集群的群组属于所述集群的概率的平均值，包括：对于任一集群，所述计算机系统提取出被划分至所述集群的群组属于所述集群的概率中大于预定概率阈值的概率；所述计算机系统计算提取出的各个概率的平均值，得到被划分至所述集群的群组属于所述集群的概率的平均值。通过提取出被划分至某一集群且属于该集群的概率中大于预定概率阈值的概率的群组，来计算该集群的概率的平均值，避免集群的概率的平均值受到概率较低的群组的影响，平均值产生较大偏差。

可选的，所述所述计算机系统利用所述第二类概率对所述第一类概率进行修正，包括：对于任一集群，所述计算机系统计算第一参数和修正前的第一类概率中所述用户属于所述集群的概率的乘积，得到第一乘积；所述计算机系统将第二参数和所述第二类概率中所述集群的概率的平均值的乘积，得到第二乘积；所述计算机系统将所述第一乘积与所述第二乘积相加，得到修正后的第一类概率中所述集群所对应的概率；其中，所述第一参数与所述第二参数之和为1。

可选的，所述迭代终止条件为：迭代次数达到预定次数阈值，或，最后相邻两次得到的修改正后的第一类概率的欧氏距离小于预定距离阈值。

第二方面，提供了一种通过计算机系统实现的将用户划分至集群的装置，所述装置包括：第一获取模块，用于利用计算机系统获取所述用户的好友用户；第二获取模块，用于对于任一集群，利用所述计算机系统获取各个好友用户判定所述用户属于所述集群的判定结果，每个判定结果用于指示每个好友用户判定所述用户是否属于所述集群；第一计算模块，用于利用所述计算机系统根据所述第二获取模块获取的所述判定结果、各个好友用户的可信度以及好友用户的参考数量，计算所述用户分别属于各个集群的概率，将得到的各个所述概率记为第一类概率；第一划分模块，用于利用所述计算机系统将所述用户划分至所述得到的所述第一计算模块计算的第一类概率中最大概率所对应的集群。

可选的，所述装置还包括：第二计算模块，用于在所述得到的各个所述概率记为第一类概率之后，在所述用户已经加入了至少一个群组时，利用所述计算机系统计算所述用户所加入的群组分别属于各个集群的概率；第二划分模块，用于对于任一群组，利用所述计算机系统确定出所述群组所属的各个集群中概率最大的集群，将所述群组划分至所述集群中。

可选的，所述装置还包括：第三计算模块，用于对于任一集群，利用所述计算机系统计算被划分至所述集群的群组属于所述集群的概率的平均值；组合模块，用于利用所述计算机系统将各个集群所对应的平均值组成第二类概率；修正模块，用于利用所述计算机系统利用所述第三计算模块计算的所述第二类概率对所述第一计算模块计算的所述第一类概率进行修正，得到所述用户分别属于各个集群的修正后的第一类概率；第三划分模块，用于利用所述计算机系统确定出所述修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。

可选的，所述第三划分模块，包括：迭代单元，用于利用所述计算机系统执行所述计算所述用户所加入群组分别属于各个集群的概率的步骤，直至得到的修正后的第一类概率符合迭代终止条件；划分单元，用于利用所述计算机系统确定出最后得到的修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。

可选的，所述第一计算模块，包括：第一累加单元，用于对于任一个集群，利用所述计算机系统将判定所述用户属于所述集群的各个好友用户的可信度进行累加，得到好友用户判定所述用户属于所述集群的权重，所述权重为所述集群的各个好友用户的可信度之和；第一计算单元，用于利用所述计算机系统将所述第一累加单元累加的所述集群的权重除以各个集群的权重之和，得到所述集群的相对强度，所述相对强度为所述集群的权重占各个集群的权重之和的比例；第二计算单元，用于利用所述计算机系统按照与所述第一累加单元累加的所述集群的权重相关的计算公式，计算所述集群的证据支撑度；第三计算单元，用于利用所述计算机系统将所述第一计算单元计算的所述集群的相对强度乘以所述第二计算单元计算的所述集群的证据支撑度，得到所述用户属于所述集群的概率；其中，所述计算公式为：所述λ_i为第i个集群的证据支撑度，所述T为所述好友用户的参考数量，T≤n，n为所述用户的好友用户的总数量，所述ω(i)为好友用户判定所述用户属于所述第i个集群的权重。

可选的，所述第二计算模块，包括：获取单元，用于对于所述用户加入的每个群组，利用所述计算机系统获取所述群组内各个群成员属于各个集群的概率；第四计算单元，用于对于任一集群，利用所述计算机系统计算各个群成员属于所述集群的概率的平均值，将所述平均值记为所述群组属于所述集群的概率。

可选的，所述第三计算模块，包括：提取单元，用于对于任一集群，利用所述计算机系统提取出被划分至所述集群的群组属于所述集群的概率中大于预定概率阈值的概率；第五计算单元，用于利用所述计算机系统计算所述提取单元提取出的各个概率的平均值，得到被划分至所述集群的群组属于所述集群的概率的平均值。

可选的，所述修正模块，包括：第六计算单元，用于对于任一集群，利用所述计算机系统计算第一参数和修正前的第一类概率中所述用户属于所述集群的概率的乘积，得到第一乘积；第七计算单元，用于利用所述计算机系统将第二参数和所述第二类概率中所述集群的概率的平均值的乘积，得到第二乘积；第八计算单元，用于利用所述计算机系统将所述第六计算单元计算的所述第一乘积与所述第七计算单元计算的所述第二乘积相加，得到修正后的第一类概率中所述集群所对应的概率；其中，所述第一参数与所述第二参数之和为1。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例中提供的通过计算机系统实现的将用户划分至集群的方法的流程图；

图2A是本发明另一个实施例中提供的通过计算机系统实现的将用户划分至集群的方法的流程图；

图2B是本发明一个实施例中提供的计算用户分别属于各个集群的概率方法的流程图；

图2C是本发明一个实施例中提供的用户所加入的群组分别属于各个集群的概率的示意图；

图2D是本发明一个实施例中提供的计算该用户所加入的群组分别属于各个集群的概率方法的流程图；

图2E是本发明一个实施例中提供的该群组内各个群成员属于各个集群的概率的示意图；

图2F是本发明一个实施例中提供的计算被划分至该集群的群组属于该集群的概率的平均值方法的流程图；

图2G是本发明一个实施例中提供的利用第二类概率对第一类概率进行修正方法的流程图；

图2H是本发明一个实施例中提供的计算机系统确定出修正后的第一类概率中概率最大的集群，将用户划分至该集群中方法的流程图；

图3是本发明一个实施例中提供的通过计算机系统实现的将用户划分至集群的装置的结构方框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明一个实施例中提供的通过计算机系统实现的将用户划分至集群的方法的流程图。如图1所示，该通过计算机系统实现的将用户划分至集群的方法包括以下步骤。

步骤101，计算机系统获取用户的好友用户。

步骤102，对于任一集群，计算机系统获取各个好友用户判定用户属于该集群的判定结果，每个判定结果用于指示每个好友用户判定该用户是否属于该集群。

步骤103，计算机系统根据判定结果、各个好友用户的可信度以及好友用户的参考数量，计算用户分别属于各个集群的概率，将得到的各个概率记为第一类概率。

步骤104，计算机系统将用户划分至得到的第一类概率中最大概率所对应的集群。

综上所述，本发明实施例中提供的通过计算机系统实现的将用户划分至集群的方法，通过根据获取各个好友用户判定用户属于各个集群的判定结果、各个好友用户的可信度以及好友用户的参考数量，计算用户分别属于各个集群的第一类概率，将该用户划分至得到的第一类概率中最大概率所对应的集群，由于用户所属某一集群的第一类概率与该用户的各个好友用户判定用户属于各个集群的判定结果、各个好友用户的可信度以及好友用户的参考数量相关；因此解决了相关技术中通常是由用户自行选择属于的集群的集群划分方法准确率较低，且带有用户的主观性的问题；达到了准确的判断出用户属于的集群，为用户提供与该集群相应的服务，更好的满足用户的需求的效果。

图2A是本发明另一个实施例中提供的通过计算机系统实现的将用户划分至集群的方法的流程图。如图2A所示，该通过计算机系统实现的将用户划分至集群的方法包括以下步骤。

步骤201，计算机系统获取用户的好友用户。

这里所讲的用户通常是指虚拟社交网络账号，这里所讲的好友用户通常是指与该用户存在虚拟人际交流的其他用户账号，该用户可以与好友用户在客户端和/或真实世界中可以具有好友关系也可以不具有好友关系。该虚拟人际交流是基于一种双向确认的方式，需用户之间互相确认。例如，两个用户互相加好友或互相关注后，彼此建立了社交关系，双方成为彼此的社交网络联系人。

步骤202，对于任一集群，计算机系统获取各个好友用户判定用户属于该集群的判定结果。

可选的，每个判定结果用于指示每个好友用户判定该用户是否属于该集群。

这里所讲的判定结果可以用0和1来表示，当某一好友用户判定该用户属于某个集群时，则该好友用户判定该用户属于该集群的判定结果为是，该判定结果用1来表示，当好友用户判定该用户属于某个集群时，则该好友用户判定该用户属于该集群的判定结果为否，该判定结果用0来表示。

具体的，服务器可以向用户的各个好友用户推送与用来判定用户属于各个集群的相关问卷信息，通过接收各个好友用户反馈给服务器的问卷答复，来获取各个好友用户判定用户属于各个集群的判定结果，当然获取各个好友用户判定用户属于各个集群的判定结果的途径有多种，对此本实施例不作具体限定。

步骤203，计算机系统根据判定结果、各个好友用户的可信度以及好友用户的参考数量，计算用户分别属于各个集群的概率，将得到的各个概率记为第一类概率。

这里所讲的第一类概率是指该用户属于各个集群的概率的集合，当服务器计算得到该用户属于各个集群的概率后，可以将属于各个集群的概率以矩阵的形式来表示该用户属于各个集群的概率所构成的第一类概率。比如，第一类概率可以表示为：P＝[P₁ P₂...P_m-1P_m]，其中P为用户属于各个集群的概率所构成的第一类概率，P_m为该用户属于第m个集群的概率。

在一种可能的实现方式中，图2B是本发明一个实施例中提供的计算用户分别属于各个集群的概率方法的流程图。如图2B所示，步骤203可以被步骤203a至步骤203d代替。

步骤203a，对于任一个集群，计算机系统将判定用户属于该集群的各个好友用户的可信度进行累加，得到好友用户判定用户属于该集群的权重。

服务器可以根据好友用户的在线上或线下消费情况、好友用户的身份认证信息、好友用户的工作单位认证信息等信息来综合考量好友用户的可信度。

当服务器获取到各个好友用户判定用户属于各个集群的判定结果后，将判定该用户属于同一集群的各个好友用户的可信度进行累加，最终得到好友用户判定该用户属于各个集群的权重。

具体的，将判定用户属于集群的各个好友用户的可信度进行累加的过程可以采用以下公式进行计算：

ω (i) = Σ_{j = 1}^{n} C_{j} \times I (j),

其中，ω(i)为好友用户判定该用户属于第i个集群的权重，n为该用户的用户好友的总数量，Cj为第j个好友用户的可信度，I(j)为第j个好友用户判定用户属于各个集群的判定结果。

步骤203b，计算机系统将集群的权重除以各个集群的权重之和，得到该集群的相对强度。

具体的，将集群的权重除以各个集群的权重之和的过程可以采用以下公式进行计算：

β_{i} = \frac{ω (i)}{Σ_{1}^{m} ω (i)},

其中，βi为第i个集群的相对强度，m为集群的总数量。

步骤203c，计算机系统按照与集群的权重相关的计算公式，计算该集群的证据支撑度。

这里所讲的计算公式为：

λ_{i} = \frac{1}{1 + e^{- \frac{ω (i)}{T}}},

其中，λ_i为第i个集群的证据支撑度，e为自然常数(约为2.71828)，T为好友用户的参考数量，T≤n。

当T越大时，说明服务器在计算该集群的相对强度所要考量的用户好友的数量(及参考数量)越多，计算该集群的相对强度的结果越严格。由该计算公式可知，T取值越大，λ_i越小。

步骤203d，计算机系统将集群的相对强度乘以该集群的证据支撑度，得到用户属于该集群的概率。

具体的，将集群的相对强度乘以该集群的证据支撑度的过程可以采用以下公式进行计算：

P_i＝λ_i×β_i，

其中，Pi为该用户属于第i个集群的概率。

步骤204，计算机系统将用户划分至得到的第一类概率中最大概率所对应的集群。

这里所讲的群组是指用户自主加入的虚拟群组，处于同一虚拟群组中的各个群成员彼此可以进行互动。

在用户尚未加入群组时，服务器可以直接根据用户好友判定用户属于各个集群的判定结果，通过一系列的计算公式，计算得到该用户属于各个集群的概率所构成的第一类概率。

由于用户属于某个集群的概率越大时，该用户属于该集群的可能性越大，因此当服务器计算得到该用户属于各个集群的概率所构成的第一类概率后，可以将该用户划分至得到的第一类概率中最大概率所对应的集群。

步骤205，在用户已经加入了至少一个群组时，计算机系统计算该用户所加入的群组分别属于各个集群的概率。

对于任一群组，该群组中各个群成员属于各个集群的概率可以用矩阵Z来表示：其中，Y为用户所加入的群组分别属于各个客群的概率的集合，m为集群的总数量，n为群组的总数量。那么，P₁₁表示群组1属于集群1的概率，P_1m表示群组1属于集群m的概率，也就是说，Y中的每一行的元素为每个群组属于各个集群的概率，类似的，P₂₁表示群组2属于集群1的概率，P_2m表示群组2属于集群m的概率，也就是说，Y中的每一列的元素为各个群组属于每个集群的概率。

图2C是本发明一个实施例中提供的用户所加入的群组分别属于各个集群的概率的示意图。如图2C所示，当说明用户加入的群组1属于客群1的概率为0.7，属于集群2为0.3，用户加入的群组2属于集群1的概率为0.8，用户加入的群组3不属于任何集群。

在一种可能的实现方式中，图2D是本发明一个实施例中提供的计算机系统计算该用户所加入的群组分别属于各个集群的概率方法的流程图。如图2D所示，步骤205可以被步骤205a至步骤205c代替。

步骤205a，对于用户加入的每个群组，计算机系统获取该群组内各个群成员属于各个集群的概率。

当服务器获取用户所加入的各个群组后，获取各个群组内预定个群成员属于各个集群的概率。

这里所讲的预定个群成员可以是群组内的全部群成员，也可以是群组内的指定数量群成员，对此本实施例不作具体限定。

对于任一群组，该群组中各个群成员属于各个集群的概率可以用矩阵Z来表示：其中，Z_k为第k个群组，m为集群的总数量，n为群成员的总数量。那么，P_a1表示群成员a属于集群1的概率，P_am表示群成员a属于集群m的概率，也就是说，Z_k中的每一行的元素为每个群成员属于各个集群的概率，类似的，P_b1表示群成员b属于集群1的概率，P_bm表示群成员b属于集群m的概率，也就是说，Z_k中的每一列的元素为各个群成员属于每个集群的概率。

图2E是本发明一个实施例中提供的该群组内各个群成员属于各个集群的概率的示意图。如图2E所示，当说明在群组1中，群成员a属于集群1的概率为0.7，属于集群2为0.3，群成员b属于集群1的概率为0.8，群成员c不属于任何集群。

步骤205b，对于任一集群，计算机系统计算各个群成员属于该集群的概率的平均值，将该平均值记为群组属于该集群的概率。

可选的，对于任一集群，计算同一群组中各个群成员属于该集群的概率的概率和的过程可以采用以下公式进行计算：

G_i＝GU_{群成员矩阵}×U_i，

其中，G_i为各个群成员属于第i个集群的概率的概率和，GU_{群成员矩阵}为属于某一群组中属于第i个集群的群成员的关系矩阵，U_i为各个群成员属于第i个集群的概率的集合对应的矩阵。

求出了各个群成员属于该集群的概率的概率和后，可以根据群成员属于该集群的总人数，对各个群成员属于该集群的概率求平均值。

计算各个群成员属于该集群的概率的平均值即为对U_i中一列元素求平均。举例来讲，一个群组包括3名成员，以矩阵的形式来表示群成员属于该集群的概率，其中：

成员a：属于集群1的概率为0，属于集群2的概率为0.5，属于集群3的概率为0.8。那么，成员a属于各个集群的概率所构成的第一类概率可以表示为P_a＝[0 0.5 0.8]；

成员b：属于集群1的概率为0.7，属于集群2的概率为0.4，属于集群3的概率为0.9。那么，成员b属于各个集群的概率所构成的第一类概率可以表示为P_b＝[0.7 0.4 0.9]；

成员c：属于集群1的概率为0，属于集群2的概率为0.3，属于集群3的概率为0.1。那么，成员c属于各个集群的概率所构成的第一类概率可以表示为P_c＝[0 0.3 0.1]；

因此，群组属于集群1的概率为P1＝(0+0.7+0)/3＝0.2，群组属于集群2的概率为P2＝(0.5+0.4+0.3)/3＝0.4，群组属于集群3的概率为P3＝(0.8+0.9+0.1)/3＝0.6。

可选的，由于当用户属于某一集群的概率较小时，说明该概率不具有代表性，为了使群成员属于该集群的概率的平均值的计算结果更加准确，服务器在计算平均值之前，可以先排除各个群成员属于某一集群的概率中概率值较低的概率。具体的，服务器在计算各个群成员属于该集群的概率的平均值之前，将各个群成员属于某一集群的概率中概率值小于概率阈值的概率剔除。本实施例不限定概率阈值的大小。

在上述举例中，假设概率阈值为0.6，服务器将概率值将小于0.6的概率剔除后，计算得到群组属于集群1的概率为P1＝0.7，群组属于集群2的概率为P2＝0，群组属于集群3的概率为P3＝(0.8+0.9)/2＝0.9。

可选的，设置集群准入条件，对于每个集群，当属于该集群的群成员的成员比例小于比例阈值时，将该集群剔除。这里所讲的成员比例是指该属于该集群的群成员的总数量与该群组的群成员的总数量的比例。具体的，服务器在计算各个群成员属于该集群的概率的平均值之前，将成员比例小于比例阈值的集群剔除，群组属于被剔除集群的概率为0。本实施例不限定概率阈值的大小。

在上述举例中，假设比例阈值为0.5，那么集群1的成员比例为0.3，集群2的成员比例为1，集群3的概率为1，服务器则将集群1剔除，计算得到群组属于集群2的概率为P2＝0，群组属于集群3的概率为P3＝(0.8+0.9+0.1)/3＝0.6。

可选的，服务器将集群1剔除后，先将各个群成员属于集群1和各个群成员属于集群2的概率中小于概率阈值的概率剔除，再计算各个群成员属于该集群的概率的平均值。

在上述举例中，假设比例阈值为0.5，概率阈值为0.6。那么集群1的成员比例为0.3，集群2的成员比例为1，集群3的概率为1，服务器则将集群1剔除，再将将概率值将小于0.6的概率剔除，计算得到群组属于集群2的概率为P2＝0，群组属于集群3的概率为P3＝(0.8+0.9)/2＝0.9。

步骤206，对于任一群组，计算机系统确定出该群组所属的各个集群中概率最大的集群，将该群组划分至该集群中。

比如，群组属于集群1的概率为P1＝0.2，群组属于集群2的概率为P2＝0.4，群组属于集群3的概率为P3＝0.6，由于群组属于集群3的概率最大，因此服务器将群组划分至集群3中。

步骤207，对于任一集群，计算机系统计算被划分至该集群的群组属于该集群的概率的平均值。

在一种可能的实现方式中，图2F是本发明一个实施例中提供的计算机系统计算被划分至该集群的群组属于该集群的概率的平均值方法的流程图。如图2F所示，步骤207可以被步骤207a至步骤207b代替。

步骤207a，对于任一集群，计算机系统提取出被划分至该集群的群组属于该集群的概率中大于预定概率阈值的概率。

举例来讲，假设预定概率阈值为0.6，用户所在的群组1被划分至集群1属于集群1的概率为0.2，用户所在的群组2被划分至集群1属于集群1的概率为0.4，用户所在的群组3被划分至集群1属于集群1的概率为0.6，用户所在的群组4被划分至集群2属于集群2的概率为1.3。服务器在用户所在的群组中，无法提取出被划分至集群1的群组属于集群1中大于0.6的概率，可以提取出被划分至集群1的群组属于集群2中大于0.6的概率1.3。

需要说明的是，本实施例不限定预定概率阈值的大小。

步骤207b，计算机系统计算提取出的各个概率的平均值，得到被划分至该集群的群组属于该集群的概率的平均值。

比如，假设服务器所提取出的被划分至某一集群的群组属于该集群的概率中，有3个群组属于集群1，其中：

群组1属于集群1的概率为0.6，群组2属于集群1的概率为0.7，群组3属于集群1的概率为0.8。

有3个群组属于集群2，其中：

群组4属于集群2的概率为0.5，群组5属于集群2的概率为0.7，群组6属于集群2的概率为0.9。

通过计算，被划分至集群1的群组属于集群1的概率的平均值为(0.6+0.7+0.8)/3＝0.7，被划分至集群2的群组属于集群2的概率的平均值为(0.5+0.7+0.9)/3＝0.7。

可选的，服务器将被划分至某一集群的群组属于该集群的概率中小于概率阈值的概率剔除后，再计算提取出的各个概率的属于该集群的平均值，得到被划分至该集群的群组属于该集群的概率的平均值。

在上述举例中，假设概率阈值为0.5，服务器将群组4属于集群2的概率剔除后，通过计算，得到群组属于集群1的概率的平均值为(0.6+0.7+0.8)/3＝0.7，群组属于集群2的概率的平均值为(0.7+0.9)/2＝0.8。

步骤208，计算机系统将各个集群所对应的平均值组成第二类概率。

这里所讲的第二类概率也可以用矩阵的形式表示。

举例来讲，设被划分至集群1的群组属于集群1的概率的平均值为Q1＝0.2，被划分至集群2的群组属于集群2的概率的平均值为Q2＝0.4，被划分至集群3的群组属于集群3的概率的平均值为Q3＝0.6。那么，群组属于各个集群的概率所构成的第二类概率(用Q来表示)为Q＝[0.2 0.4 0.6]。

步骤209，计算机系统利用第二类概率对第一类概率进行修正，得到用户分别属于各个集群的修正后的第一类概率。

在一种可能的实现方式中，图2G是本发明一个实施例中提供的计算机系统利用第二类概率对第一类概率进行修正方法的流程图。如图2G所示，步骤209可以被步骤209a至步骤209c代替。

步骤209a，对于任一集群，计算机系统计算第一参数和修正前的第一类概率中用户属于该集群的概率的乘积，得到第一乘积。

步骤209b，计算机系统将第二参数和第二类概率中集群的概率的平均值的乘积，得到第二乘积。

步骤209c，计算机系统将第一乘积与第二乘积相加，得到修正后的第一类概率中该集群所对应的概率。

需要说明的是，这里所讲的第一参数与第二参数之和为1。

具体的，利用第二类概率对第一类概率进行修正的过程可以采用以下公式进行计算：

P_i′＝α×P_i+(1-α)×Q_i，

其中，P_i′为用户分别属于第i集群的修正后的第一类概率，Q_i为第i个集群的群组属于第i个集群的概率的平均值，α为第一参数，(1-α)为第二参数。

当α>(1-α)时，说明P_i′的取值受P_i的影响更大，当α<(1-α)时，说明P_i′的取值受Q_i的影响更大。

步骤210，计算机系统确定出修正后的第一类概率中概率最大的集群，将用户划分至该集群中。

在一种可能实现的方式中，图2H是本发明一个实施例中提供的计算机系统确定出修正后的第一类概率中概率最大的集群，将用户划分至该集群中方法的流程图。如图2H所示，步骤210可以被步骤210a至步骤210b代替。

步骤210a，计算机系统执行计算用户所加入群组分别属于各个集群的概率的步骤，直至得到的修正后的第一类概率符合迭代终止条件。

步骤210b，计算机系统确定出最后得到的修正后的第一类概率中概率最大的集群，将用户划分至该集群中。

由于用户属于某个集群的概率越大时，该用户属于该集群的可能性越大，因此当服务器计算得到修正后的第一类概率中集群所对应的概率后，可以将该用户划分至得到的修正后的第一类概率中最大概率所对应的集群。

当迭代终止条件为迭代次数达到预定次数阈值时，迭代次数的初始值为0，当服务器利用第二类概率对第一类概率进行修正后，判断迭代次数是否达到预定次数阈值，若迭代次数达到预定次数阈值，则将用户划分至最后得到的修正后的第一类概率中最大概率所对应的集群。

当迭代终止条件为最后相邻两次得到的修改正后的第一类概率的欧氏距离小于预定距离阈值时，当服务器利用第二类概率对第一类概率进行修正后，判段修正后的第一类概率P_i′与第一类概率P_i欧氏距离是否小于预定距离阈值，若欧氏距离是否小于预定距离阈值，则将用户划分至最后得到的修正后的第一类概率中最大概率所对应的集群。

需要说明的是，本实施例不限定预定次数阈值和预定距离阈值的大小。

在本实施例中，通过迭代计算，不断利用该第二类概率对第一类概率进行修正，使得修正后的第一类概率更为精准。

在本实施例中，通过提取出被划分至某一集群且属于该集群的概率中大于预定概率阈值的概率的群组，来计算该集群的概率的平均值，避免集群的概率的平均值受到概率较低的群组的影响，平均值产生较大偏差。

下述为本发明装置实施例，对于装置实施例中未详尽描述的细节，可以参考上述一一对应的方法实施例。

图3是本发明一个实施例中提供的通过计算机系统实现的将用户划分至集群的装置的结构方框图。如图3所示，该通过计算机系统实现的将用户划分至集群的装置包括：第一获取模块301、第二获取模块302、第一计算模块303和第一划分模块304。

第一获取模块301，用于利用计算机系统获取用户的好友用户；

第二获取模块302，用于对于任一集群，利用计算机系统获取各个好友用户判定用户属于该集群的判定结果，每个判定结果用于指示每个好友用户判定该用户是否属于该集群；

第一计算模块303，用于利用计算机系统根据第二获取模块302获取的判定结果、各个好友用户的可信度以及好友用户的参考数量，计算用户分别属于各个集群的概率，将得到的各个该概率记为第一类概率；

第一划分模块304，用于利用计算机系统将用户划分至得到的第一计算模块303计算的第一类概率中最大概率所对应的集群。

该装置还包括：第二计算模块、第二划分模块。

第二计算模块，用于在得到的各个概率记为第一类概率之后，在用户已经加入了至少一个群组时，利用计算机系统计算该用户所加入的群组分别属于各个集群的概率；

第二划分模块，用于对于任一群组，利用计算机系统确定出群组所属的各个集群中概率最大的集群，将该群组划分至该集群中。

该装置包括：第三计算模块、组合模块、修正模块和第三划分模块。

第三计算模块，用于对于任一集群，利用计算机系统计算被划分至集群的群组属于该集群的概率的平均值；

组合模块，用于利用计算机系统将各个集群所对应的平均值组成第二类概率；

修正模块，用于利用计算机系统利用第三计算模块计算的第二类概率对第一计算模块303计算的第一类概率进行修正，得到用户分别属于各个集群的修正后的第一类概率；

第三划分模块310，用于利用计算机系统确定出修正后的第一类概率中概率最大的集群，将用户划分至该集群中。

第三划分模块，包括：迭代单元和划分单元。

迭代单元，用于利用计算机系统执行计算用户所加入群组分别属于各个集群的概率的步骤，直至得到的修正后的第一类概率符合迭代终止条件；

划分单元，用于利用计算机系统确定出最后得到的修正后的第一类概率中概率最大的集群，将用户划分至该集群中。

该第一计算模块303，包括：第一累加单元、第一计算单元、第二计算单元和第三计算单元。

第一累加单元，用于对于任一个集群，利用计算机系统将判定用户属于该集群的各个好友用户的可信度进行累加，得到好友用户判定该用户属于该集群的权重，该权重为该集群的各个好友用户的可信度之和；

第一计算单元，用于利用计算机系统将第一累加单元累加的集群的权重除以各个集群的权重之和，得到该集群的相对强度，该相对强度为该集群的权重占各个集群的权重之和的比例；

第二计算单元，用于利用计算机系统按照与第一累加单元累加的集群的权重相关的计算公式，计算该集群的证据支撑度；

第三计算单元，用于利用计算机系统将第一计算单元计算的集群的相对强度乘以第二计算单元计算的该集群的证据支撑度，得到该用户属于该集群的概率；

其中，该计算公式为：

λ_{i} = \frac{1}{1 + e^{- \frac{ω (i)}{T}}},

该λi为第i个集群的证据支撑度，该T为好友用户的参考数量，T≤n，n为该用户的好友用户的总数量，该ω(i)为好友用户判定该用户属于第i个集群的权重。

该第二计算模块，包括：获取单元和第四计算单元。

获取单元，用于对于用户加入的每个群组，利用计算机系统获取群组内各个群成员属于各个集群的概率；

第四计算单元，用于对于任一集群，利用计算机系统计算各个群成员属于集群的概率的平均值，将该平均值记为该群组属于该集群的概率。

该第三计算模块，包括：提取单元和第五计算单元。

提取单元，用于对于任一集群，利用计算机系统提取出被划分至该集群的群组属于该集群的概率中大于预定概率阈值的概率；

第五计算单元，用于利用计算机系统计算该提取单元提取出的各个概率的平均值，得到被划分至集群的群组属于该集群的概率的平均值。

该迭代模块，包括：第六计算单元、第七计算单元和第八计算单元。

第六计算单元，用于对于任一集群，利用计算机系统计算第一参数和修正前的第一类概率中用户属于该集群的概率的乘积，得到第一乘积；

第七计算单元，用于利用计算机系统将第二参数和第二类概率中集群的概率的平均值的乘积，得到第二乘积；

第八计算单元，用于利用计算机系统将第六计算单元计算的第一乘积与第七计算单元计算的第二乘积相加，得到修正后的第一类概率中集群所对应的概率；

其中，该第一参数与该第二参数之和为1。

该迭代终止条件为：迭代次数达到预定次数阈值，或，最后相邻两次得到的修改正后的第一类概率的欧氏距离小于预定距离阈值。

综上所述，本发明实施例中提供的通过计算机系统实现的将用户划分至集群的装置，通过根据获取各个好友用户判定用户属于各个集群的判定结果、各个好友用户的可信度以及好友用户的参考数量，计算用户分别属于各个集群的第一类概率，将该用户划分至得到的第一类概率中最大概率所对应的集群，由于用户所属某一集群的第一类概率与该用户的各个好友用户判定用户属于各个集群的判定结果、各个好友用户的可信度以及好友用户的参考数量相关；因此解决了相关技术中通常是由用户自行选择属于的集群的集群划分方法准确率较低，且带有用户的主观性的问题；达到了准确的判断出用户属于的集群，为用户提供与该集群相应的服务，更好的满足用户的需求的效果。

需要说明的是：上述实施例中提供的通过计算机系统实现的将用户划分至集群的装置在显示视图时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将智能设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的通过计算机系统实现的将用户划分至集群的装置与通过计算机系统实现的将用户划分至集群的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种通过计算机系统实现的将用户划分至集群的方法，其特征在于，所述方法包括：

计算机系统获取所述用户的好友用户；

对于任一集群，所述计算机系统获取各个好友用户判定所述用户属于所述集群的判定结果，每个判定结果用于指示每个好友用户判定所述用户是否属于所述集群；

所述计算机系统根据所述判定结果、各个好友用户的可信度以及好友用户的参考数量，计算所述用户分别属于各个集群的概率，将得到的各个所述概率记为第一类概率；

所述计算机系统将所述用户划分至所述得到的第一类概率中最大概率所对应的集群。

2.根据权利要求1所述的方法，其特征在于，在所述将得到的各个所述概率记为第一类概率，所述方法还包括：

在所述用户已经加入了至少一个群组时，所述计算机系统计算所述用户所加入的群组分别属于各个集群的概率；

对于任一群组，所述计算机系统确定出所述群组所属的各个集群中概率最大的集群，将所述群组划分至所述集群中。

3.根据权利要求2所述的方法，其特征在于，在所述将所述群组划分至所述集群中之后，所述方法还包括：

对于任一集群，所述计算机系统计算被划分至所述集群的群组属于所述集群的概率的平均值；

所述计算机系统将各个集群所对应的平均值组成第二类概率；

所述计算机系统利用所述第二类概率对所述第一类概率进行修正，得到所述用户分别属于各个集群的修正后的第一类概率；

所述计算机系统确定出所述修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。

4.根据权利要求3所述的方法，其特征在于，所述计算机系统确定出所述修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中，包括：

所述计算机系统执行所述计算所述用户所加入群组分别属于各个集群的概率的步骤，直至得到的修正后的第一类概率符合迭代终止条件；

所述计算机系统确定出最后得到的修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。

5.根据权利要求1所述的方法，其特征在于，所述计算机系统根据所述判定结果、各个好友用户的可信度以及好友用户的参考数量，计算所述用户分别属于各个集群的概率，包括：

对于任一个集群，所述计算机系统将判定所述用户属于所述集群的各个好友用户的可信度进行累加，得到好友用户判定所述用户属于所述集群的权重；

所述计算机系统将所述集群的权重除以各个集群的权重之和，得到所述集群的相对强度；

所述计算机系统按照与所述集群的权重相关的计算公式，计算所述集群的证据支撑度；

所述计算机系统将所述集群的相对强度乘以所述集群的证据支撑度，得到所述用户属于所述集群的概率；

其中，所述计算公式为：

λ_{i} = \frac{1}{1 + e^{- \frac{ω (i)}{T}}},

所述λ_i为第i个集群的证据支撑度，所述T为所述好友用户的参考数量，T≤n，n为所述用户的好友用户的总数量，所述ω(i)为好友用户判定所述用户属于所述第i个集群的权重。

6.根据权利要求2所述的方法，其特征在于，所述所述计算机系统计算所述用户所加入的群组分别属于各个集群的概率，包括：

对于所述用户加入的每个群组，所述计算机系统获取所述群组内各个群成员属于各个集群的概率；

对于任一集群，所述计算机系统计算各个群成员属于所述集群的概率的平均值，将所述平均值记为所述群组属于所述集群的概率。

7.根据权利要求3所述的方法，其特征在于，所述对于任一集群，所述计算机系统计算被划分至所述集群的群组属于所述集群的概率的平均值，包括：

对于任一集群，所述计算机系统提取出被划分至所述集群的群组属于所述集群的概率中大于预定概率阈值的概率；

所述计算机系统计算提取出的各个概率的平均值，得到被划分至所述集群的群组属于所述集群的概率的平均值。

8.根据权利要求3所述的方法，其特征在于，所述所述计算机系统利用所述第二类概率对所述第一类概率进行修正，包括：

对于任一集群，所述计算机系统计算第一参数和修正前的第一类概率中所述用户属于所述集群的概率的乘积，得到第一乘积；

所述计算机系统将第二参数和所述第二类概率中所述集群的概率的平均值的乘积，得到第二乘积；

所述计算机系统将所述第一乘积与所述第二乘积相加，得到修正后的第一类概率中所述集群所对应的概率；

其中，所述第一参数与所述第二参数之和为1。

9.根据权利要求4所述的方法，其特征在于，所述迭代终止条件为：迭代次数达到预定次数阈值，或，最后相邻两次得到的修改正后的第一类概率的欧氏距离小于预定距离阈值。

10.一种通过计算机系统实现的将用户划分至集群的装置，其特征在于，所述装置包括：

第一获取模块，用于利用计算机系统获取所述用户的好友用户；

第二获取模块，用于对于任一集群，利用所述计算机系统获取各个好友用户判定所述用户属于所述集群的判定结果，每个判定结果用于指示每个好友用户判定所述用户是否属于所述集群；

第一计算模块，用于利用所述计算机系统根据所述第二获取模块获取的所述判定结果、各个好友用户的可信度以及好友用户的参考数量，计算所述用户分别属于各个集群的概率，将得到的各个所述概率记为第一类概率；

第一划分模块，用于利用所述计算机系统将所述用户划分至所述得到的所述第一计算模块计算的第一类概率中最大概率所对应的集群。

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

第二计算模块，用于在所述得到的各个所述概率记为第一类概率之后，在所述用户已经加入了至少一个群组时，利用所述计算机系统计算所述用户所加入的群组分别属于各个集群的概率；

第二划分模块，用于对于任一群组，利用所述计算机系统确定出所述群组所属的各个集群中概率最大的集群，将所述群组划分至所述集群中。

12.根据权利要求11所述的装置，其特征在于，所述装置还包括：

第三计算模块，用于对于任一集群，利用所述计算机系统计算被划分至所述集群的群组属于所述集群的概率的平均值；

组合模块，用于利用所述计算机系统将各个集群所对应的平均值组成第二类概率；

修正模块，用于利用所述计算机系统利用所述第三计算模块计算的所述第二类概率对所述第一计算模块计算的所述第一类概率进行修正，得到所述用户分别属于各个集群的修正后的第一类概率；

第三划分模块，用于利用所述计算机系统确定出所述修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。

13.根据权利要求12所述的方法，其特征在于，所述第三划分模块，包括：

迭代单元，用于利用所述计算机系统执行所述计算所述用户所加入群组分别属于各个集群的概率的步骤，直至得到的修正后的第一类概率符合迭代终止条件；

划分单元，用于利用所述计算机系统确定出最后得到的修正后的第一类概率中概率最大的集群，将所述用户划分至所述集群中。

14.根据权利要求10所述的装置，其特征在于，所述第一计算模块，包括：

第一累加单元，用于对于任一个集群，利用所述计算机系统将判定所述用户属于所述集群的各个好友用户的可信度进行累加，得到好友用户判定所述用户属于所述集群的权重，所述权重为所述集群的各个好友用户的可信度之和；

第一计算单元，用于利用所述计算机系统将所述第一累加单元累加的所述集群的权重除以各个集群的权重之和，得到所述集群的相对强度，所述相对强度为所述集群的权重占各个集群的权重之和的比例；

第二计算单元，用于利用所述计算机系统按照与所述第一累加单元累加的所述集群的权重相关的计算公式，计算所述集群的证据支撑度；

第三计算单元，用于利用所述计算机系统将所述第一计算单元计算的所述集群的相对强度乘以所述第二计算单元计算的所述集群的证据支撑度，得到所述用户属于所述集群的概率；

其中，所述计算公式为：

λ_{i} = \frac{1}{1 + e^{- \frac{ω (i)}{T}}},

15.根据权利要求11所述的装置，其特征在于，所述第二计算模块，包括：

获取单元，用于对于所述用户加入的每个群组，利用所述计算机系统获取所述群组内各个群成员属于各个集群的概率；

第四计算单元，用于对于任一集群，利用所述计算机系统计算各个群成员属于所述集群的概率的平均值，将所述平均值记为所述群组属于所述集群的概率。

16.根据权利要求12所述的装置，其特征在于，所述第三计算模块，包括：

提取单元，用于对于任一集群，利用所述计算机系统提取出被划分至所述集群的群组属于所述集群的概率中大于预定概率阈值的概率；

第五计算单元，用于利用所述计算机系统计算所述提取单元提取出的各个概率的平均值，得到被划分至所述集群的群组属于所述集群的概率的平均值。

17.根据权利要求12所述的装置，其特征在于，所述修正模块，包括：

第六计算单元，用于对于任一集群，利用所述计算机系统计算第一参数和修正前的第一类概率中所述用户属于所述集群的概率的乘积，得到第一乘积；

第七计算单元，用于利用所述计算机系统将第二参数和所述第二类概率中所述集群的概率的平均值的乘积，得到第二乘积；

第八计算单元，用于利用所述计算机系统将所述第六计算单元计算的所述第一乘积与所述第七计算单元计算的所述第二乘积相加，得到修正后的第一类概率中所述集群所对应的概率；

其中，所述第一参数与所述第二参数之和为1。

18.根据权利要求13中任一所述的装置，其特征在于，所述迭代终止条件为：迭代次数达到预定次数阈值，或，最后相邻两次得到的修改正后的第一类概率的欧氏距离小于预定距离阈值。