CN108287864B

CN108287864B - 一种兴趣群组划分方法、装置、介质及计算设备

Info

Publication number: CN108287864B
Application number: CN201711277641.1A
Authority: CN
Inventors: 黄维东; 黄俊洲
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-12-06
Filing date: 2017-12-06
Publication date: 2020-07-10
Anticipated expiration: 2037-12-06
Also published as: CN108287864A

Abstract

本申请提供一种兴趣群组划分方法、装置、介质及计算设备，该方法包括：构建浏览网络图，其中，所述浏览网络图中的节点为浏览过对象的用户，所述浏览网络图中的边为具有相同兴趣的用户，每个边上包括两个用户且所述两个用户具有相同兴趣；确定所述浏览网络图中每个边上两个节点的词向量之间的相似度；根据确定的相似度，计算所述浏览网络图中各个边的权重值；根据所述浏览网络图中各个边的权重值以及节点，确定以用户兴趣为群组划分标准的兴趣群组划分结果。本申请能够提高群组内成员的交流活跃度、提高用于浏览对象的应用程序中用户的粘性。

Description

一种兴趣群组划分方法、装置、介质及计算设备

技术领域

本申请涉及社交网络技术领域，尤其涉及一种兴趣群组划分方法、装置、介质及计算设备。

背景技术

本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

随着互联网技术的高速发展，新闻类应用程序数量越来越多，阅读新闻类应用程序中文章的用户也越来越多。目前，在新闻类应用程序中，具备不同具有兴趣的用户加入相应兴趣的群组中的功能，在用户阅读文章的过程中，可向用户推荐不同的兴趣群组，以提醒用户加入相应群组，与该群组中的成员进行互动。

现阶段，向用户推荐兴趣群组的方式为：

将具有相同标签的文章划分至同一兴趣群组；根据用户浏览文章的历史数据，确定用户的兴趣标签；为用户推荐用户的兴趣标签对应的兴趣群组。

发明人发现，目前的兴趣群组的划分是基于单一标签的划分，这样划分得到的结果为，一个群组仅对应一个标签，即一个群组对应单一的兴趣点，由于单一兴趣点的限制会导致群组内成员的交流活跃度较低的问题。

发明内容

本申请提供一种兴趣群组划分方法、装置、介质及计算设备，用于解决现有技术划分得到的兴趣群组中由于单一兴趣点的限制所导致的群组内成员的交流活跃度较低的问题。

第一方面，本申请实施例提供一种兴趣群组划分方法，包括：

针对浏览过对象的用户，构建浏览网络图，其中，所述浏览网络图中的节点为浏览过对象的用户，所述浏览网络图中的边为具有相同兴趣的用户，每个边上包括两个用户且所述两个用户具有相同兴趣；

确定所述浏览网络图中每个边上两个节点的词向量之间的相似度；

根据确定的相似度，计算所述浏览网络图中各个边的权重值；

根据所述浏览网络图中各个边的权重值以及节点，确定以用户兴趣为群组划分标准的兴趣群组划分结果。

可选地，针对浏览过对象的用户，构建浏览网络图，具体包括：

以所有浏览过对象的用户为节点，以所有浏览过对象的用户中具有相同兴趣的用户为边，构建初始浏览网络图；

根据确定的所述用户的特征数据，对所述初始浏览网络图进行过滤，得到所述浏览网络图。

可选地，根据确定的所述用户的特征数据，对所述初始浏览网络图进行过滤，具体包括：

根据确定的所述用户的特征数据，计算所述初始浏览网络图中每个边上的两个用户之间的相似度；

滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。

可选地，确定所述用户的特征数据，具体包括：

获取用户在预设时间段内浏览对象的历史数据；

从所述历史数据中提取所述用户的特征数据。

可选地，所述用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种。

可选地，确定所述浏览网络图中每个边上两个节点的词向量之间的相似度，具体包括：

生成所述浏览网络图中每个节点的节点序列；

利用各个节点的节点序列，确定各个节点的词向量；

针对所述浏览网络图中的每个边，计算该边上的两个节点的词向量之间的相似度。

可选地，根据确定的相似度，计算所述浏览网络图中各个边的权重值，具体包括：

针对所述浏览网络图中的每个边，将该边上的两个节点的词向量之间的相似度作为该边的权重值。

可选地，本申请实施例提供的兴趣群组划分方法，还包括；

响应于当前用户浏览对象的操作，获取所述当前用户对应的各个兴趣标签；

将所述当前用户对应的所有兴趣标签作为一个关键词组；

分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度，其中，兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成；

向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。

第二方面，本申请实施例提供一种兴趣群组划分装置，包括：

构建模块，用于针对浏览过对象的用户，构建浏览网络图，其中，所述浏览网络图中的节点为浏览过对象的用户，所述浏览网络图中的边为具有相同兴趣的用户，每个边上包括两个用户且所述两个用户具有相同兴趣；

第一确定模块，用于确定所述浏览网络图中每个边上两个节点的词向量之间的相似度；

计算模块，用于根据确定的相似度，计算所述浏览网络图中各个边的权重值；

第二确定模块，用于根据所述浏览网络图中各个边的权重值以及节点，确定以用户兴趣为群组划分标准的兴趣群组划分结果。

可选地，所述构建模块，具体包括：

构建单元，用于以所有浏览过对象的用户为节点，以所有浏览过对象的用户中具有相同兴趣的用户为边，构建初始浏览网络图；

过滤单元，用于根据确定的所述用户的特征数据，对所述初始浏览网络图进行过滤，得到所述浏览网络图。

可选地，所述过滤单元，具体用于：

可选地，本申请实施例提供的兴趣群组划分装置，还包括：

第三确定模块，用于按照以下方式确定所述用户的特征数据：

获取用户在预设时间段内浏览对象的历史数据；

从所述历史数据中提取所述用户的特征数据。

可选地，所述第一确定模块，具体用于：

生成所述浏览网络图中每个节点的节点序列；

利用各个节点的节点序列，确定各个节点的词向量；

可选地，所述计算模块，具体用于：

可选地，本申请实施例提供的兴趣群组划分装置，还包括；

获取模块，用于响应于当前用户浏览对象的操作，获取所述当前用户对应的各个兴趣标签；

第四确定模块，用于将所述当前用户对应的所有兴趣标签作为一个关键词组；

第五确定模块，用于分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度，其中，兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成；

推荐模块，用于向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。

第三方面，本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现上述任一兴趣群组划分方法的步骤。

第四方面，本申请实施例提供一种计算设备，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述程序时实现上述任一兴趣群组划分方法的步骤。

利用本申请实施例提供的兴趣群组划分方法、装置、介质及计算设备，具有以下有益效果：浏览网络图的边为具有相同兴趣的用户，根据浏览网络图中的各边的权重以及浏览网络图中的节点，对兴趣群组进行划分，能够使得划分得到的兴趣群组中包括具有不同兴趣的用户，即划分得到的任意一个兴趣群组中包括多个兴趣点，此时，一个兴趣群组对应多个兴趣标签，加入相应群组的用户可与群组内其他用户进行多个兴趣点的互动，从而提高了群组内成员的交流活跃度，也能够在一定程度上提高用于浏览对象的应用程序中用户的粘性。

附图说明

图1为本申请实施例提供的兴趣群组划分方法的流程示意图；

图2为本申请实施例提供的构建浏览网络图的方法流程示意图；

图3为本申请实施例提供的对初始浏览网络图进行过滤的方法流程示意图；

图4为本申请实施例提供的两个节点的词向量之间的相似度的方法流程示意图；

图5为本申请实施例提供的向用户推荐兴趣群组的方法流程示意图；

图6为本申请实施例提供的兴趣群组划分方法的具体实施过程流程示意图；

图7为本申请实施例提供的兴趣群组划分装置的结构示意图；

图8为本申请实施例提供的计算设备的硬件结构示意图。

具体实施方式

下面将结合附图对本申请可能的实施方式作进一步描述。

本申请实施例提供一种兴趣群组划分方法，如图1所示，包括：

步骤101，针对浏览过对象的用户，构建浏览网络图，其中，所述浏览网络图中的节点为浏览过对象的用户，所述浏览网络图中的边为具有相同兴趣的用户，每个边上包括两个用户且所述两个用户具有相同兴趣。

其中，浏览网络图用于表征浏览过对象的用户之间的兴趣分布情况。具体实施时，针对浏览过对象的用户，获取浏览过对象的用户的历史浏览数据，从历史浏览数据中提取具有相同兴趣的用户，将具有相同兴趣的两个用户作为浏览网络图中的边，将浏览过对象的用户作为浏览网络中的节点，构建得到浏览网络图，或者，可以根据历史浏览数据构建初始浏览网络图，通过对初始浏览网络图进行过滤，得到浏览网络图。浏览网络图中的边上对应的两个用户具有相同的兴趣。可选地，可针对在一定时间段内浏览过对象的用户，构建浏览网络图。

其中，对象可以为文章、网页、微博等，具有相同兴趣可以为具有相同兴趣，相同兴趣可以为浏览过相同对象，还可以为浏览过相似对象，或者，为具有相同或相似兴趣标签，这里不做限定。举例说明确定浏览网络图中的边的方式：假设对象为文章，则针对被浏览过的同一篇文章，确定浏览过该文章的所有用户，将浏览过该文章的所有用户中的两两不同用户组成浏览网络图中的针对该文章的各个边。

步骤102，确定所述浏览网络图中每个边上两个节点的词向量之间的相似度。

具体实施时，针对浏览网络图中的每个边，确定该边上的两个节点中每个节点的词向量，进而确定这两个节点的词向量之间的相似度。具体实施时，可根据浏览网络图中各个节点对应的用户的特征数据，确定浏览网络图中各个节点的词向量；可计算两个节点的词向量之间的距离，将该距离作为这两个节点的词向量之间的相似度。

步骤103，根据确定的相似度，计算所述浏览网络图中各个边的权重值。

具体实施时，根据各个边上两个节点的词向量之间的相似度，确定相应边的权重值。可选地，针对所述浏览网络图中的每个边，将该边上的两个节点的词向量之间的相似度作为该边的权重值，即将计算得到的浏览网络图中每个边上的两个节点的词向量之间的相似度，作为相应边的权重值，比如边A上的两个节点的词向量之间的相似度即为边A的权重值。也可利用现有的边的权重值的计算方式确定本申请实施例中的边的权重值，这里不做限定。

步骤104，根据所述浏览网络图中各个边的权重值以及节点，确定以用户兴趣为群组划分标准的兴趣群组划分结果。

具体实施时，根据所述浏览网络图中各个边的权重值以及节点，利用预设社区发现算法，确定以用户兴趣为群组划分标准的兴趣群组划分结果。其中，预设社区发现算法可以为Parallel Louvain算法，具体利用Parallel Louvain算法，贪婪式搜索不同的群组最大化模块度，从而得到以用户兴趣为群组划分标准的兴趣群组划分结果。其中，最大化模块度W的计算公式如下：

W＝∑(A_ij-gamma*K_i*K_j/2m)*d(s_i，s_j)

其中，i和j为浏览网络途中的节点标识，A_ij为节点i和节点j所在边的权重值，gamma是超参数，K_i为节点i所在的所有边的权重值之和，m为浏览网络图中所有边的权重值之和，d(s_i,s_j)在节点i和j有连接时为1，无连接时为0。

预设社区发现算法也可以为community detection等用于划分群组的算法，这里不做限定。本申请实施例中的兴趣群组划分方法为无监督的兴趣群组划分方法。

本申请实施例，浏览网络图的边为具有相同兴趣的用户，根据浏览网络图中的各边的权重以及浏览网络图中的节点，对兴趣群组进行划分，能够使得划分得到的兴趣群组中包括具有不同兴趣的用户，即划分得到的任意一个兴趣群组中包括多个兴趣点，此时，一个兴趣群组对应多个兴趣标签，加入相应群组的用户可与群组内其他用户进行多个兴趣点的互动，从而提高了群组内成员的交流活跃度，也能够在一定程度上提高用于浏览对象的应用程序中用户的粘性。

需要说明的是，本申请实施例可应用于阅读推荐类、新闻类等可进行对象阅读的应用程序中。

可选地，按照图2提供的内容，针对浏览过对象的用户，构建浏览网络图：

步骤201，以所有浏览过对象的用户为节点，以所有浏览过对象的用户中具有相同兴趣的用户为边，构建初始浏览网络图。

具体实施时，获取在一定时间段内浏览过对象的用户的历史浏览数据，从历史浏览数据中提取具有相同兴趣的用户，将具有相同兴趣的两个用户作为浏览网络图中的边，将用户作为浏览网络中的节点，构建得到初始浏览网络图。

步骤202，根据确定的所述用户的特征数据，对所述初始浏览网络图进行过滤，得到所述浏览网络图。

具体实施时，预先确定各个用户的特征数据，根据用户的特征数据，对初始浏览网络图中的边和节点进行过滤，从而得到浏览网络图。其中，可过滤掉初始浏览网络图中具有相同兴趣但特征数据不相似的边以及该边上的节点，这样得到的浏览网络图中的边上的用户不仅具有相同兴趣而且边上的两个用户的特征数据还具有较高的相似度，使得兴趣群组划分结果更加准确。

可选地，按照图3提供的内容，其特征在于，根据确定的所述用户的特征数据，对所述初始浏览网络图进行过滤：

步骤301，根据确定的所述用户的特征数据，计算所述初始浏览网络图中每个边上的两个用户之间的相似度。

具体实施时，可获取用户在预设时间段内浏览对象的历史浏览数据；从获取的历史浏览数据中提取用户的特征数据。其中，用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种，用户的属性特征数据可以包括用户的账号数据、兴趣标签数据，还可以包括用户年龄、所在地区等特征数据，用户的浏览行为特征数据可以包括浏览时间、浏览时长等行为特征数据，用户浏览过的对象的特征数据可以包括对象的类型、对象的大小、对象中是否带有图片等特征数据，对象的类型可以包括娱乐、社会、生活、财经等类型，当对象为文章时，对象的特征数据还可以包括文章的长短特征数据。

根据用户的特征数据，计算初始浏览网络图中每个边上的两个用户之间的相似度，即以用户的特征数据为特征向量，计算两个用户的特征数据对应的特征向量之间的相似度。其中，可使用神经网络点击率模型，选择该模型中的隐含层作为用户的特征数据之间的映射向量，再计算两个向量之间的距离，将计算得到距离作为两个用户之间的相似度，具体的用户之间的相似度计算为现有过程，这里不做详述。

本步骤中，针对初始浏览网络图中的每个边，将该边上的两个用户之间的相似度即为该边上的两个节点之间的相似度。

步骤302，滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。

具体实施时，边上的两个用户对应的节点即为该边上的两个节点，得到初始浏览网络图中每个边上的两个用户之间的相似度之后，将相似度小于第一阈值的两个用户对应的节点以及相似度小于第一阈值的两个用户对应的节点所在的边滤除，将初始浏览网络图中未被滤除的边和节点构成浏览网络图。第一阈值的大小可根据实际应用场景设定，这里不做限定。

可选地，按照图4提供的内容，确定所述浏览网络图中每个边上两个节点的词向量之间的相似度：

步骤401，生成所述浏览网络图中每个节点的节点序列。

具体实施时，针对浏览网络图中的每个节点，利用随机游走(random walk)算法，从该节点触发，以概率P访问与该节点相邻的节点，以生成该节点的节点序列。其中，概率P的计算公式如下：

其中，U1为该节点对应的用户阅读过的对象集合，U2为与该节点相邻的节点对应的用户阅读过的对象集合，Count(U1∩U2)为U1与U2的交集中的对象总数，Count(U1∪U2)为U1与U2的并集中的对象总数。得到的节点序列中的元素为节点的特征数据，即节点对应的用户的特征数据。

步骤402，利用各个节点的节点序列，确定各个节点的词向量。

具体实施时，可将各个节点的节点序列作为待训练skip-gram模型的输入数据，训练完成后将skip-gram模型对应的网络结构中相应的权值作为相应节点的词向量，具体的skip-gram模型训练过程为现有过程，这里不做详述。也可以利用其它用于确定词向量的方式确定各个节点的词向量，这里不做限定。

步骤403，针对所述浏览网络图中的每个边，计算该边上的两个节点的词向量之间的相似度。

确定出兴趣群组划分结果后，得到划分得到的各个兴趣群组以及各个兴趣群组的标题，兴趣群组的标题可以由该兴趣群组中各个用户对应的兴趣标签组成，也可以为由从该兴趣群组中各个用户阅读对象中提取的关键字组成，这里不做限定。可选地，如图5所示，本申请实施例提供的兴趣群组划分方法，还可以包括：

步骤501，响应于当前用户浏览对象的操作，获取所述当前用户对应的各个兴趣标签。

具体实施时，当前用户为兴趣群组划分完成之后进行对象浏览的用户，当前用户对应的兴趣标签可以为从该当前用户填写的基本资料中获取的兴趣标签，或者，为根据该用户的浏览对象的历史记录，通过机器学习确定出的兴趣标签。

步骤502，将所述当前用户对应的所有兴趣标签作为一个关键词组。

具体实施时，将当前用户对应的所有兴趣标签作为一个关键词组，以便于划分得到的兴趣群组进行相似度计算。

步骤503，分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度，其中，兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成。

具体实施时，针对划分得到的每个兴趣群组，计算当前用户的兴趣标签组成的关键词组与该兴趣群组的标题之间的语义相似度，作为当前用户的兴趣标签组成的关键词组与该兴趣群组的标题之间的相似度。

步骤504，向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。

具体实施时，从兴趣群组中提取与关键词组的相似度超过第二阈值的兴趣群组推荐给当前用户，以提示当前用户加入相应的兴趣群组。第二阈值的大小可根据实际应用场景设定，这里不做限定。

在实际应用中，可间歇性的记录向用户推荐相似度超过第二阈值的兴趣群组后，用户所加入的相似度超过第二阈值的兴趣群组，作为第一类群组，也可记录未经兴趣群组推荐，用户主动加入的兴趣群组，作为第二类群组。在利用图1提供的实施例确定兴趣群组划分结果后，持续对兴趣群组划分结果进行更新，具体可根据浏览网络图中的节点和边，以及第一类群组和第二类群组，对兴趣群组划分结果进行更新，也可仅根据第一类群组和第二类群组对兴趣群组划分结果进行更新，从而提高兴趣群组划分的准确性。

下面详细介绍本申请实施例提供的兴趣群组划分方法的具体实施过程，如图6所示，包括：

步骤601，以所有浏览过对象的用户为节点，以所有浏览过对象的用户中具有相同兴趣的用户为边，构建初始浏览网络图。

步骤602，根据确定的所述用户的特征数据，计算所述初始浏览网络图中每个边上的两个用户之间的相似度。

其中，确定用户的特征数据的方式为：获取用户在预设时间段内浏览对象的历史数据；从所述历史数据中提取所述用户的特征数据。

步骤603，滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边，得到浏览网络图。

具体的，将初始浏览网络图中未被滤除的边和节点构成浏览网络图。

步骤604，生成所述浏览网络图中每个节点的节点序列。

步骤605，利用各个节点的节点序列，确定各个节点的词向量。

步骤606，针对所述浏览网络图中的每个边，计算该边上的两个节点的词向量之间的相似度。

步骤607，将计算得到的该相似度作为该边的权重值。

步骤608，根据所述浏览网络图中各个边的权重值以及节点，利用预设社区发现算法，确定以用户兴趣为群组划分标准的兴趣群组划分结果。

介绍了本申请实施例提供的兴趣群组划分方法之后，下面结合附图7介绍本申请实施例提供的兴趣群组划分装置。

本申请实施例提供一种兴趣群组划分装置，如图7所示，包括：

构建模块701，用于针对浏览过对象的用户，构建浏览网络图，其中，所述浏览网络图中的节点为浏览过对象的用户，所述浏览网络图中的边为具有相同兴趣的用户，每个边上包括两个用户且所述两个用户具有相同兴趣；

第一确定模块702，用于确定所述浏览网络图中每个边上两个节点的词向量之间的相似度；

计算模块703，用于根据确定的相似度，计算所述浏览网络图中各个边的权重值；

第二确定模块704，用于根据所述浏览网络图中各个边的权重值以及节点，确定以用户兴趣为群组划分标准的兴趣群组划分结果。

可选地，所述构建模块701，具体包括：

构建单元7011，用于以所有浏览过对象的用户为节点，以所有浏览过对象的用户中具有相同兴趣的用户为边，构建初始浏览网络图；

过滤单元7012，用于根据确定的所述用户的特征数据，对所述初始浏览网络图进行过滤，得到所述浏览网络图。

可选地，所述过滤单元7012，具体用于：

可选地，本申请实施例提供的兴趣群组划分装置，还包括：

第三确定模块705，用于按照以下方式确定所述用户的特征数据：

获取用户在预设时间段内浏览对象的历史数据；

从所述历史数据中提取所述用户的特征数据。

可选地，所述第一确定模块702，具体用于：

生成所述浏览网络图中每个节点的节点序列；

利用各个节点的节点序列，确定各个节点的词向量；

可选地，所述计算模块703，具体用于：

可选地，本申请实施例提供的兴趣群组划分装置，还包括；

获取模块706，用于响应于当前用户浏览对象的操作，获取所述当前用户对应的各个兴趣标签；

第四确定模块707，用于将所述当前用户对应的所有兴趣标签作为一个关键词组；

第五确定模块708，用于分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度，其中，兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成；

推荐模块709，用于向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。

介绍了本申请实施例提供的兴趣群组划分方法和装置之后，下面介绍本申请实施例提供的用于兴趣群组划分的介质。

本申请实施例提供一种计算机存储介质，所述计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现上述实施例提供的任一兴趣群组划分方法的步骤。可选地，该计算机存储介质为非易失型的计算机可存储介质。

介绍了本申请实施例提供的兴趣群组划分方法、装置和介质之后，下面结合附图8介绍本申请实施例提供的用于兴趣群组划分的计算设备。

本申请实施例提供一种计算设备包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述程序时实现上述任一兴趣群组划分方法的步骤。

本申请实施例提供一种计算设备，用于执行实施例中的兴趣群组划分方法，如图8所示，为本申请实施四中所述的计算设备的硬件结构示意图，该计算设备具体可以为的桌面计算机、便携式计算机、智能手机、平板电脑等。具体地，该计算设备可以包括存储器801、处理器802及存储在存储器上的计算机程序，所述处理器执行所述程序时实现实施例的兴趣群组划分方法的步骤。其中，存储器801可以包括只读存储器(ROM)和随机存取存储器(RAM)，并向处理器802提供存储器801中存储的程序指令和数据。

进一步地，本申请实施例中所述的计算设备还可以包括输入装置803以及输出装置804等。输入装置803可以包括键盘、鼠标、触摸屏等；输出装置804可以包括显示设备，如液晶显示器(Liquid Crystal Display，LCD)、阴极射线管(Cathode Ray Tube，CRT)，触摸屏等。存储器801，处理器802、输入装置803和输出装置804可以通过总线或者其他方式连接，图8中以通过总线连接为例。

处理器802调用存储器801存储的程序指令并按照获得的程序指令执行实施例提供的兴趣群组划分方法。

应当注意，尽管在上文详细描述中提及了兴趣群组划分装置的若干模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims

1.一种兴趣群组划分方法，其特征在于，包括：

构建浏览网络图，其中，所述浏览网络图中的节点为浏览过对象的用户，所述浏览网络图中的边为具有相同兴趣的用户，每个边上包括两个用户且所述两个用户具有相同兴趣；

根据所述浏览网络图中各个边的权重值以及节点，

确定以用户兴趣为群组划分标准的兴趣群组划分结果；

根据所述浏览网络图中的节点和边，以及第一类群组和第二类群组，对兴趣群组划分结果进行更新，或根据第一类群组和第二类群组对兴趣群组划分结果进行更新；所述第一类群组为用户所加入的相似度超过第二阈值的兴趣群组，所述第二类群组为未经兴趣群组推荐用户主动加入的兴趣群组。

2.根据权利要求1所述的方法，其特征在于，针对浏览过对象的用户，构建浏览网络图，具体包括：

3.根据权利要求2所述的方法，其特征在于，根据确定的所述用户的特征数据，对所述初始浏览网络图进行过滤，具体包括：

4.根据权利要求2或3所述的方法，其特征在于，确定所述用户的特征数据，具体包括：

获取用户在预设时间段内浏览对象的历史数据；

从所述历史数据中提取所述用户的特征数据。

5.根据权利要求4所述的方法，其特征在于，所述用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种。

6.根据权利要求1所述的方法，其特征在于，确定所述浏览网络图中每个边上两个节点的词向量之间的相似度，具体包括：

生成所述浏览网络图中每个节点的节点序列；

利用各个节点的节点序列，确定各个节点的词向量；

7.根据权利要求1或6所述的方法，其特征在于，根据确定的相似度，计算所述浏览网络图中各个边的权重值，具体包括：

8.根据权利要求1所述的方法，其特征在于，还包括；

将所述当前用户对应的所有兴趣标签作为一个关键词组；

9.一种兴趣群组划分装置，其特征在于，包括：

第二确定模块，用于根据所述浏览网络图中各个边的权重值以及节点，确定以用户兴趣为群组划分标准的兴趣群组划分结果；

第二确定模块还用于：根据所述浏览网络图中的节点和边，以及第一类群组和第二类群组，对兴趣群组划分结果进行更新，或根据第一类群组和第二类群组对兴趣群组划分结果进行更新；所述第一类群组为用户所加入的相似度超过第二阈值的兴趣群组，所述第二类群组为未经兴趣群组推荐用户主动加入的兴趣群组。

10.根据权利要求9所述的装置，其特征在于，所述构建模块，具体包括：

11.根据权利要求10所述的装置，其特征在于，所述过滤单元，具体用于：

12.根据权利要求10或11所述的装置，其特征在于，还包括：

获取用户在预设时间段内浏览对象的历史数据；

从所述历史数据中提取所述用户的特征数据。

13.根据权利要求12所述的装置，其特征在于，所述用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种。

14.根据权利要求9所述的装置，其特征在于，所述第一确定模块，具体用于：

生成所述浏览网络图中每个节点的节点序列；

利用各个节点的节点序列，确定各个节点的词向量；

15.根据权利要求9或14所述的装置，其特征在于，所述计算模块，具体用于：

16.根据权利要求9所述的装置，其特征在于，还包括；

17.一种计算机存储介质，其特征在于，所述计算机存储介质存储有可执行程序，该可执行程序被处理器执行实现权利要求1-8任一所述方法的步骤。

18.一种计算设备，其特征在于，包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述程序时实现权利要求1-8任一所述方法的步骤。