CN108287864B - 一种兴趣群组划分方法、装置、介质及计算设备 - Google Patents

一种兴趣群组划分方法、装置、介质及计算设备 Download PDF

Info

Publication number
CN108287864B
CN108287864B CN201711277641.1A CN201711277641A CN108287864B CN 108287864 B CN108287864 B CN 108287864B CN 201711277641 A CN201711277641 A CN 201711277641A CN 108287864 B CN108287864 B CN 108287864B
Authority
CN
China
Prior art keywords
interest
network graph
user
users
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711277641.1A
Other languages
English (en)
Other versions
CN108287864A (zh
Inventor
黄维东
黄俊洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201711277641.1A priority Critical patent/CN108287864B/zh
Publication of CN108287864A publication Critical patent/CN108287864A/zh
Application granted granted Critical
Publication of CN108287864B publication Critical patent/CN108287864B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本申请提供一种兴趣群组划分方法、装置、介质及计算设备,该方法包括:构建浏览网络图,其中,所述浏览网络图中的节点为浏览过对象的用户,所述浏览网络图中的边为具有相同兴趣的用户,每个边上包括两个用户且所述两个用户具有相同兴趣;确定所述浏览网络图中每个边上两个节点的词向量之间的相似度;根据确定的相似度,计算所述浏览网络图中各个边的权重值;根据所述浏览网络图中各个边的权重值以及节点,确定以用户兴趣为群组划分标准的兴趣群组划分结果。本申请能够提高群组内成员的交流活跃度、提高用于浏览对象的应用程序中用户的粘性。

Description

一种兴趣群组划分方法、装置、介质及计算设备
技术领域
本申请涉及社交网络技术领域,尤其涉及一种兴趣群组划分方法、装置、介质及计算设备。
背景技术
本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网技术的高速发展,新闻类应用程序数量越来越多,阅读新闻类应用程序中文章的用户也越来越多。目前,在新闻类应用程序中,具备不同具有兴趣的用户加入相应兴趣的群组中的功能,在用户阅读文章的过程中,可向用户推荐不同的兴趣群组,以提醒用户加入相应群组,与该群组中的成员进行互动。
现阶段,向用户推荐兴趣群组的方式为:
将具有相同标签的文章划分至同一兴趣群组;根据用户浏览文章的历史数据,确定用户的兴趣标签;为用户推荐用户的兴趣标签对应的兴趣群组。
发明人发现,目前的兴趣群组的划分是基于单一标签的划分,这样划分得到的结果为,一个群组仅对应一个标签,即一个群组对应单一的兴趣点,由于单一兴趣点的限制会导致群组内成员的交流活跃度较低的问题。
发明内容
本申请提供一种兴趣群组划分方法、装置、介质及计算设备,用于解决现有技术划分得到的兴趣群组中由于单一兴趣点的限制所导致的群组内成员的交流活跃度较低的问题。
第一方面,本申请实施例提供一种兴趣群组划分方法,包括:
针对浏览过对象的用户,构建浏览网络图,其中,所述浏览网络图中的节点为浏览过对象的用户,所述浏览网络图中的边为具有相同兴趣的用户,每个边上包括两个用户且所述两个用户具有相同兴趣;
确定所述浏览网络图中每个边上两个节点的词向量之间的相似度;
根据确定的相似度,计算所述浏览网络图中各个边的权重值;
根据所述浏览网络图中各个边的权重值以及节点,确定以用户兴趣为群组划分标准的兴趣群组划分结果。
可选地,针对浏览过对象的用户,构建浏览网络图,具体包括:
以所有浏览过对象的用户为节点,以所有浏览过对象的用户中具有相同兴趣的用户为边,构建初始浏览网络图;
根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,得到所述浏览网络图。
可选地,根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,具体包括:
根据确定的所述用户的特征数据,计算所述初始浏览网络图中每个边上的两个用户之间的相似度;
滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。
可选地,确定所述用户的特征数据,具体包括:
获取用户在预设时间段内浏览对象的历史数据;
从所述历史数据中提取所述用户的特征数据。
可选地,所述用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种。
可选地,确定所述浏览网络图中每个边上两个节点的词向量之间的相似度,具体包括:
生成所述浏览网络图中每个节点的节点序列;
利用各个节点的节点序列,确定各个节点的词向量;
针对所述浏览网络图中的每个边,计算该边上的两个节点的词向量之间的相似度。
可选地,根据确定的相似度,计算所述浏览网络图中各个边的权重值,具体包括:
针对所述浏览网络图中的每个边,将该边上的两个节点的词向量之间的相似度作为该边的权重值。
可选地,本申请实施例提供的兴趣群组划分方法,还包括;
响应于当前用户浏览对象的操作,获取所述当前用户对应的各个兴趣标签;
将所述当前用户对应的所有兴趣标签作为一个关键词组;
分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度,其中,兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成;
向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。
第二方面,本申请实施例提供一种兴趣群组划分装置,包括:
构建模块,用于针对浏览过对象的用户,构建浏览网络图,其中,所述浏览网络图中的节点为浏览过对象的用户,所述浏览网络图中的边为具有相同兴趣的用户,每个边上包括两个用户且所述两个用户具有相同兴趣;
第一确定模块,用于确定所述浏览网络图中每个边上两个节点的词向量之间的相似度;
计算模块,用于根据确定的相似度,计算所述浏览网络图中各个边的权重值;
第二确定模块,用于根据所述浏览网络图中各个边的权重值以及节点,确定以用户兴趣为群组划分标准的兴趣群组划分结果。
可选地,所述构建模块,具体包括:
构建单元,用于以所有浏览过对象的用户为节点,以所有浏览过对象的用户中具有相同兴趣的用户为边,构建初始浏览网络图;
过滤单元,用于根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,得到所述浏览网络图。
可选地,所述过滤单元,具体用于:
根据确定的所述用户的特征数据,计算所述初始浏览网络图中每个边上的两个用户之间的相似度;
滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。
可选地,本申请实施例提供的兴趣群组划分装置,还包括:
第三确定模块,用于按照以下方式确定所述用户的特征数据:
获取用户在预设时间段内浏览对象的历史数据;
从所述历史数据中提取所述用户的特征数据。
可选地,所述用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种。
可选地,所述第一确定模块,具体用于:
生成所述浏览网络图中每个节点的节点序列;
利用各个节点的节点序列,确定各个节点的词向量;
针对所述浏览网络图中的每个边,计算该边上的两个节点的词向量之间的相似度。
可选地,所述计算模块,具体用于:
针对所述浏览网络图中的每个边,将该边上的两个节点的词向量之间的相似度作为该边的权重值。
可选地,本申请实施例提供的兴趣群组划分装置,还包括;
获取模块,用于响应于当前用户浏览对象的操作,获取所述当前用户对应的各个兴趣标签;
第四确定模块,用于将所述当前用户对应的所有兴趣标签作为一个关键词组;
第五确定模块,用于分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度,其中,兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成;
推荐模块,用于向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。
第三方面,本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现上述任一兴趣群组划分方法的步骤。
第四方面,本申请实施例提供一种计算设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现上述任一兴趣群组划分方法的步骤。
利用本申请实施例提供的兴趣群组划分方法、装置、介质及计算设备,具有以下有益效果:浏览网络图的边为具有相同兴趣的用户,根据浏览网络图中的各边的权重以及浏览网络图中的节点,对兴趣群组进行划分,能够使得划分得到的兴趣群组中包括具有不同兴趣的用户,即划分得到的任意一个兴趣群组中包括多个兴趣点,此时,一个兴趣群组对应多个兴趣标签,加入相应群组的用户可与群组内其他用户进行多个兴趣点的互动,从而提高了群组内成员的交流活跃度,也能够在一定程度上提高用于浏览对象的应用程序中用户的粘性。
附图说明
图1为本申请实施例提供的兴趣群组划分方法的流程示意图;
图2为本申请实施例提供的构建浏览网络图的方法流程示意图;
图3为本申请实施例提供的对初始浏览网络图进行过滤的方法流程示意图;
图4为本申请实施例提供的两个节点的词向量之间的相似度的方法流程示意图;
图5为本申请实施例提供的向用户推荐兴趣群组的方法流程示意图;
图6为本申请实施例提供的兴趣群组划分方法的具体实施过程流程示意图;
图7为本申请实施例提供的兴趣群组划分装置的结构示意图;
图8为本申请实施例提供的计算设备的硬件结构示意图。
具体实施方式
下面将结合附图对本申请可能的实施方式作进一步描述。
本申请实施例提供一种兴趣群组划分方法,如图1所示,包括:
步骤101,针对浏览过对象的用户,构建浏览网络图,其中,所述浏览网络图中的节点为浏览过对象的用户,所述浏览网络图中的边为具有相同兴趣的用户,每个边上包括两个用户且所述两个用户具有相同兴趣。
其中,浏览网络图用于表征浏览过对象的用户之间的兴趣分布情况。具体实施时,针对浏览过对象的用户,获取浏览过对象的用户的历史浏览数据,从历史浏览数据中提取具有相同兴趣的用户,将具有相同兴趣的两个用户作为浏览网络图中的边,将浏览过对象的用户作为浏览网络中的节点,构建得到浏览网络图,或者,可以根据历史浏览数据构建初始浏览网络图,通过对初始浏览网络图进行过滤,得到浏览网络图。浏览网络图中的边上对应的两个用户具有相同的兴趣。可选地,可针对在一定时间段内浏览过对象的用户,构建浏览网络图。
其中,对象可以为文章、网页、微博等,具有相同兴趣可以为具有相同兴趣,相同兴趣可以为浏览过相同对象,还可以为浏览过相似对象,或者,为具有相同或相似兴趣标签,这里不做限定。举例说明确定浏览网络图中的边的方式:假设对象为文章,则针对被浏览过的同一篇文章,确定浏览过该文章的所有用户,将浏览过该文章的所有用户中的两两不同用户组成浏览网络图中的针对该文章的各个边。
步骤102,确定所述浏览网络图中每个边上两个节点的词向量之间的相似度。
具体实施时,针对浏览网络图中的每个边,确定该边上的两个节点中每个节点的词向量,进而确定这两个节点的词向量之间的相似度。具体实施时,可根据浏览网络图中各个节点对应的用户的特征数据,确定浏览网络图中各个节点的词向量;可计算两个节点的词向量之间的距离,将该距离作为这两个节点的词向量之间的相似度。
步骤103,根据确定的相似度,计算所述浏览网络图中各个边的权重值。
具体实施时,根据各个边上两个节点的词向量之间的相似度,确定相应边的权重值。可选地,针对所述浏览网络图中的每个边,将该边上的两个节点的词向量之间的相似度作为该边的权重值,即将计算得到的浏览网络图中每个边上的两个节点的词向量之间的相似度,作为相应边的权重值,比如边A上的两个节点的词向量之间的相似度即为边A的权重值。也可利用现有的边的权重值的计算方式确定本申请实施例中的边的权重值,这里不做限定。
步骤104,根据所述浏览网络图中各个边的权重值以及节点,确定以用户兴趣为群组划分标准的兴趣群组划分结果。
具体实施时,根据所述浏览网络图中各个边的权重值以及节点,利用预设社区发现算法,确定以用户兴趣为群组划分标准的兴趣群组划分结果。其中,预设社区发现算法可以为Parallel Louvain算法,具体利用Parallel Louvain算法,贪婪式搜索不同的群组最大化模块度,从而得到以用户兴趣为群组划分标准的兴趣群组划分结果。其中,最大化模块度W的计算公式如下:
W=∑(Aij-gamma*Ki*Kj/2m)*d(si,sj)
其中,i和j为浏览网络途中的节点标识,Aij为节点i和节点j所在边的权重值,gamma是超参数,Ki为节点i所在的所有边的权重值之和,m为浏览网络图中所有边的权重值之和,d(si,sj)在节点i和j有连接时为1,无连接时为0。
预设社区发现算法也可以为community detection等用于划分群组的算法,这里不做限定。本申请实施例中的兴趣群组划分方法为无监督的兴趣群组划分方法。
本申请实施例,浏览网络图的边为具有相同兴趣的用户,根据浏览网络图中的各边的权重以及浏览网络图中的节点,对兴趣群组进行划分,能够使得划分得到的兴趣群组中包括具有不同兴趣的用户,即划分得到的任意一个兴趣群组中包括多个兴趣点,此时,一个兴趣群组对应多个兴趣标签,加入相应群组的用户可与群组内其他用户进行多个兴趣点的互动,从而提高了群组内成员的交流活跃度,也能够在一定程度上提高用于浏览对象的应用程序中用户的粘性。
需要说明的是,本申请实施例可应用于阅读推荐类、新闻类等可进行对象阅读的应用程序中。
可选地,按照图2提供的内容,针对浏览过对象的用户,构建浏览网络图:
步骤201,以所有浏览过对象的用户为节点,以所有浏览过对象的用户中具有相同兴趣的用户为边,构建初始浏览网络图。
具体实施时,获取在一定时间段内浏览过对象的用户的历史浏览数据,从历史浏览数据中提取具有相同兴趣的用户,将具有相同兴趣的两个用户作为浏览网络图中的边,将用户作为浏览网络中的节点,构建得到初始浏览网络图。
步骤202,根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,得到所述浏览网络图。
具体实施时,预先确定各个用户的特征数据,根据用户的特征数据,对初始浏览网络图中的边和节点进行过滤,从而得到浏览网络图。其中,可过滤掉初始浏览网络图中具有相同兴趣但特征数据不相似的边以及该边上的节点,这样得到的浏览网络图中的边上的用户不仅具有相同兴趣而且边上的两个用户的特征数据还具有较高的相似度,使得兴趣群组划分结果更加准确。
可选地,按照图3提供的内容,其特征在于,根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤:
步骤301,根据确定的所述用户的特征数据,计算所述初始浏览网络图中每个边上的两个用户之间的相似度。
具体实施时,可获取用户在预设时间段内浏览对象的历史浏览数据;从获取的历史浏览数据中提取用户的特征数据。其中,用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种,用户的属性特征数据可以包括用户的账号数据、兴趣标签数据,还可以包括用户年龄、所在地区等特征数据,用户的浏览行为特征数据可以包括浏览时间、浏览时长等行为特征数据,用户浏览过的对象的特征数据可以包括对象的类型、对象的大小、对象中是否带有图片等特征数据,对象的类型可以包括娱乐、社会、生活、财经等类型,当对象为文章时,对象的特征数据还可以包括文章的长短特征数据。
根据用户的特征数据,计算初始浏览网络图中每个边上的两个用户之间的相似度,即以用户的特征数据为特征向量,计算两个用户的特征数据对应的特征向量之间的相似度。其中,可使用神经网络点击率模型,选择该模型中的隐含层作为用户的特征数据之间的映射向量,再计算两个向量之间的距离,将计算得到距离作为两个用户之间的相似度,具体的用户之间的相似度计算为现有过程,这里不做详述。
本步骤中,针对初始浏览网络图中的每个边,将该边上的两个用户之间的相似度即为该边上的两个节点之间的相似度。
步骤302,滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。
具体实施时,边上的两个用户对应的节点即为该边上的两个节点,得到初始浏览网络图中每个边上的两个用户之间的相似度之后,将相似度小于第一阈值的两个用户对应的节点以及相似度小于第一阈值的两个用户对应的节点所在的边滤除,将初始浏览网络图中未被滤除的边和节点构成浏览网络图。第一阈值的大小可根据实际应用场景设定,这里不做限定。
可选地,按照图4提供的内容,确定所述浏览网络图中每个边上两个节点的词向量之间的相似度:
步骤401,生成所述浏览网络图中每个节点的节点序列。
具体实施时,针对浏览网络图中的每个节点,利用随机游走(random walk)算法,从该节点触发,以概率P访问与该节点相邻的节点,以生成该节点的节点序列。其中,概率P的计算公式如下:
Figure BDA0001496902050000101
其中,U1为该节点对应的用户阅读过的对象集合,U2为与该节点相邻的节点对应的用户阅读过的对象集合,Count(U1∩U2)为U1与U2的交集中的对象总数,Count(U1∪U2)为U1与U2的并集中的对象总数。得到的节点序列中的元素为节点的特征数据,即节点对应的用户的特征数据。
步骤402,利用各个节点的节点序列,确定各个节点的词向量。
具体实施时,可将各个节点的节点序列作为待训练skip-gram模型的输入数据,训练完成后将skip-gram模型对应的网络结构中相应的权值作为相应节点的词向量,具体的skip-gram模型训练过程为现有过程,这里不做详述。也可以利用其它用于确定词向量的方式确定各个节点的词向量,这里不做限定。
步骤403,针对所述浏览网络图中的每个边,计算该边上的两个节点的词向量之间的相似度。
确定出兴趣群组划分结果后,得到划分得到的各个兴趣群组以及各个兴趣群组的标题,兴趣群组的标题可以由该兴趣群组中各个用户对应的兴趣标签组成,也可以为由从该兴趣群组中各个用户阅读对象中提取的关键字组成,这里不做限定。可选地,如图5所示,本申请实施例提供的兴趣群组划分方法,还可以包括:
步骤501,响应于当前用户浏览对象的操作,获取所述当前用户对应的各个兴趣标签。
具体实施时,当前用户为兴趣群组划分完成之后进行对象浏览的用户,当前用户对应的兴趣标签可以为从该当前用户填写的基本资料中获取的兴趣标签,或者,为根据该用户的浏览对象的历史记录,通过机器学习确定出的兴趣标签。
步骤502,将所述当前用户对应的所有兴趣标签作为一个关键词组。
具体实施时,将当前用户对应的所有兴趣标签作为一个关键词组,以便于划分得到的兴趣群组进行相似度计算。
步骤503,分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度,其中,兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成。
具体实施时,针对划分得到的每个兴趣群组,计算当前用户的兴趣标签组成的关键词组与该兴趣群组的标题之间的语义相似度,作为当前用户的兴趣标签组成的关键词组与该兴趣群组的标题之间的相似度。
步骤504,向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。
具体实施时,从兴趣群组中提取与关键词组的相似度超过第二阈值的兴趣群组推荐给当前用户,以提示当前用户加入相应的兴趣群组。第二阈值的大小可根据实际应用场景设定,这里不做限定。
在实际应用中,可间歇性的记录向用户推荐相似度超过第二阈值的兴趣群组后,用户所加入的相似度超过第二阈值的兴趣群组,作为第一类群组,也可记录未经兴趣群组推荐,用户主动加入的兴趣群组,作为第二类群组。在利用图1提供的实施例确定兴趣群组划分结果后,持续对兴趣群组划分结果进行更新,具体可根据浏览网络图中的节点和边,以及第一类群组和第二类群组,对兴趣群组划分结果进行更新,也可仅根据第一类群组和第二类群组对兴趣群组划分结果进行更新,从而提高兴趣群组划分的准确性。
下面详细介绍本申请实施例提供的兴趣群组划分方法的具体实施过程,如图6所示,包括:
步骤601,以所有浏览过对象的用户为节点,以所有浏览过对象的用户中具有相同兴趣的用户为边,构建初始浏览网络图。
步骤602,根据确定的所述用户的特征数据,计算所述初始浏览网络图中每个边上的两个用户之间的相似度。
其中,确定用户的特征数据的方式为:获取用户在预设时间段内浏览对象的历史数据;从所述历史数据中提取所述用户的特征数据。
步骤603,滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边,得到浏览网络图。
具体的,将初始浏览网络图中未被滤除的边和节点构成浏览网络图。
步骤604,生成所述浏览网络图中每个节点的节点序列。
步骤605,利用各个节点的节点序列,确定各个节点的词向量。
步骤606,针对所述浏览网络图中的每个边,计算该边上的两个节点的词向量之间的相似度。
步骤607,将计算得到的该相似度作为该边的权重值。
步骤608,根据所述浏览网络图中各个边的权重值以及节点,利用预设社区发现算法,确定以用户兴趣为群组划分标准的兴趣群组划分结果。
介绍了本申请实施例提供的兴趣群组划分方法之后,下面结合附图7介绍本申请实施例提供的兴趣群组划分装置。
本申请实施例提供一种兴趣群组划分装置,如图7所示,包括:
构建模块701,用于针对浏览过对象的用户,构建浏览网络图,其中,所述浏览网络图中的节点为浏览过对象的用户,所述浏览网络图中的边为具有相同兴趣的用户,每个边上包括两个用户且所述两个用户具有相同兴趣;
第一确定模块702,用于确定所述浏览网络图中每个边上两个节点的词向量之间的相似度;
计算模块703,用于根据确定的相似度,计算所述浏览网络图中各个边的权重值;
第二确定模块704,用于根据所述浏览网络图中各个边的权重值以及节点,确定以用户兴趣为群组划分标准的兴趣群组划分结果。
可选地,所述构建模块701,具体包括:
构建单元7011,用于以所有浏览过对象的用户为节点,以所有浏览过对象的用户中具有相同兴趣的用户为边,构建初始浏览网络图;
过滤单元7012,用于根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,得到所述浏览网络图。
可选地,所述过滤单元7012,具体用于:
根据确定的所述用户的特征数据,计算所述初始浏览网络图中每个边上的两个用户之间的相似度;
滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。
可选地,本申请实施例提供的兴趣群组划分装置,还包括:
第三确定模块705,用于按照以下方式确定所述用户的特征数据:
获取用户在预设时间段内浏览对象的历史数据;
从所述历史数据中提取所述用户的特征数据。
可选地,所述第一确定模块702,具体用于:
生成所述浏览网络图中每个节点的节点序列;
利用各个节点的节点序列,确定各个节点的词向量;
针对所述浏览网络图中的每个边,计算该边上的两个节点的词向量之间的相似度。
可选地,所述计算模块703,具体用于:
针对所述浏览网络图中的每个边,将该边上的两个节点的词向量之间的相似度作为该边的权重值。
可选地,本申请实施例提供的兴趣群组划分装置,还包括;
获取模块706,用于响应于当前用户浏览对象的操作,获取所述当前用户对应的各个兴趣标签;
第四确定模块707,用于将所述当前用户对应的所有兴趣标签作为一个关键词组;
第五确定模块708,用于分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度,其中,兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成;
推荐模块709,用于向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。
介绍了本申请实施例提供的兴趣群组划分方法和装置之后,下面介绍本申请实施例提供的用于兴趣群组划分的介质。
本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现上述实施例提供的任一兴趣群组划分方法的步骤。可选地,该计算机存储介质为非易失型的计算机可存储介质。
介绍了本申请实施例提供的兴趣群组划分方法、装置和介质之后,下面结合附图8介绍本申请实施例提供的用于兴趣群组划分的计算设备。
本申请实施例提供一种计算设备包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现上述任一兴趣群组划分方法的步骤。
本申请实施例提供一种计算设备,用于执行实施例中的兴趣群组划分方法,如图8所示,为本申请实施四中所述的计算设备的硬件结构示意图,该计算设备具体可以为的桌面计算机、便携式计算机、智能手机、平板电脑等。具体地,该计算设备可以包括存储器801、处理器802及存储在存储器上的计算机程序,所述处理器执行所述程序时实现实施例的兴趣群组划分方法的步骤。其中,存储器801可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器802提供存储器801中存储的程序指令和数据。
进一步地,本申请实施例中所述的计算设备还可以包括输入装置803以及输出装置804等。输入装置803可以包括键盘、鼠标、触摸屏等;输出装置804可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube,CRT),触摸屏等。存储器801,处理器802、输入装置803和输出装置804可以通过总线或者其他方式连接,图8中以通过总线连接为例。
处理器802调用存储器801存储的程序指令并按照获得的程序指令执行实施例提供的兴趣群组划分方法。
利用本申请实施例提供的兴趣群组划分方法、装置、介质及计算设备,具有以下有益效果:浏览网络图的边为具有相同兴趣的用户,根据浏览网络图中的各边的权重以及浏览网络图中的节点,对兴趣群组进行划分,能够使得划分得到的兴趣群组中包括具有不同兴趣的用户,即划分得到的任意一个兴趣群组中包括多个兴趣点,此时,一个兴趣群组对应多个兴趣标签,加入相应群组的用户可与群组内其他用户进行多个兴趣点的互动,从而提高了群组内成员的交流活跃度,也能够在一定程度上提高用于浏览对象的应用程序中用户的粘性。
应当注意,尽管在上文详细描述中提及了兴趣群组划分装置的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

Claims (18)

1.一种兴趣群组划分方法,其特征在于,包括:
构建浏览网络图,其中,所述浏览网络图中的节点为浏览过对象的用户,所述浏览网络图中的边为具有相同兴趣的用户,每个边上包括两个用户且所述两个用户具有相同兴趣;
确定所述浏览网络图中每个边上两个节点的词向量之间的相似度;
根据确定的相似度,计算所述浏览网络图中各个边的权重值;
根据所述浏览网络图中各个边的权重值以及节点,
确定以用户兴趣为群组划分标准的兴趣群组划分结果;
根据所述浏览网络图中的节点和边,以及第一类群组和第二类群组,对兴趣群组划分结果进行更新,或根据第一类群组和第二类群组对兴趣群组划分结果进行更新;所述第一类群组为用户所加入的相似度超过第二阈值的兴趣群组,所述第二类群组为未经兴趣群组推荐用户主动加入的兴趣群组。
2.根据权利要求1所述的方法,其特征在于,针对浏览过对象的用户,构建浏览网络图,具体包括:
以所有浏览过对象的用户为节点,以所有浏览过对象的用户中具有相同兴趣的用户为边,构建初始浏览网络图;
根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,得到所述浏览网络图。
3.根据权利要求2所述的方法,其特征在于,根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,具体包括:
根据确定的所述用户的特征数据,计算所述初始浏览网络图中每个边上的两个用户之间的相似度;
滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。
4.根据权利要求2或3所述的方法,其特征在于,确定所述用户的特征数据,具体包括:
获取用户在预设时间段内浏览对象的历史数据;
从所述历史数据中提取所述用户的特征数据。
5.根据权利要求4所述的方法,其特征在于,所述用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种。
6.根据权利要求1所述的方法,其特征在于,确定所述浏览网络图中每个边上两个节点的词向量之间的相似度,具体包括:
生成所述浏览网络图中每个节点的节点序列;
利用各个节点的节点序列,确定各个节点的词向量;
针对所述浏览网络图中的每个边,计算该边上的两个节点的词向量之间的相似度。
7.根据权利要求1或6所述的方法,其特征在于,根据确定的相似度,计算所述浏览网络图中各个边的权重值,具体包括:
针对所述浏览网络图中的每个边,将该边上的两个节点的词向量之间的相似度作为该边的权重值。
8.根据权利要求1所述的方法,其特征在于,还包括;
响应于当前用户浏览对象的操作,获取所述当前用户对应的各个兴趣标签;
将所述当前用户对应的所有兴趣标签作为一个关键词组;
分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度,其中,兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成;
向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。
9.一种兴趣群组划分装置,其特征在于,包括:
构建模块,用于针对浏览过对象的用户,构建浏览网络图,其中,所述浏览网络图中的节点为浏览过对象的用户,所述浏览网络图中的边为具有相同兴趣的用户,每个边上包括两个用户且所述两个用户具有相同兴趣;
第一确定模块,用于确定所述浏览网络图中每个边上两个节点的词向量之间的相似度;
计算模块,用于根据确定的相似度,计算所述浏览网络图中各个边的权重值;
第二确定模块,用于根据所述浏览网络图中各个边的权重值以及节点,确定以用户兴趣为群组划分标准的兴趣群组划分结果;
第二确定模块还用于:根据所述浏览网络图中的节点和边,以及第一类群组和第二类群组,对兴趣群组划分结果进行更新,或根据第一类群组和第二类群组对兴趣群组划分结果进行更新;所述第一类群组为用户所加入的相似度超过第二阈值的兴趣群组,所述第二类群组为未经兴趣群组推荐用户主动加入的兴趣群组。
10.根据权利要求9所述的装置,其特征在于,所述构建模块,具体包括:
构建单元,用于以所有浏览过对象的用户为节点,以所有浏览过对象的用户中具有相同兴趣的用户为边,构建初始浏览网络图;
过滤单元,用于根据确定的所述用户的特征数据,对所述初始浏览网络图进行过滤,得到所述浏览网络图。
11.根据权利要求10所述的装置,其特征在于,所述过滤单元,具体用于:
根据确定的所述用户的特征数据,计算所述初始浏览网络图中每个边上的两个用户之间的相似度;
滤除相似度小于第一阈值的两个用户对应的节点以及相似度小于所述第一阈值的两个对应的节点所在的边。
12.根据权利要求10或11所述的装置,其特征在于,还包括:
第三确定模块,用于按照以下方式确定所述用户的特征数据:
获取用户在预设时间段内浏览对象的历史数据;
从所述历史数据中提取所述用户的特征数据。
13.根据权利要求12所述的装置,其特征在于,所述用户的特征数据包括用户的属性特征数据、用户的浏览行为特征数据以及用户浏览过的对象的特征数据中的一种或多种。
14.根据权利要求9所述的装置,其特征在于,所述第一确定模块,具体用于:
生成所述浏览网络图中每个节点的节点序列;
利用各个节点的节点序列,确定各个节点的词向量;
针对所述浏览网络图中的每个边,计算该边上的两个节点的词向量之间的相似度。
15.根据权利要求9或14所述的装置,其特征在于,所述计算模块,具体用于:
针对所述浏览网络图中的每个边,将该边上的两个节点的词向量之间的相似度作为该边的权重值。
16.根据权利要求9所述的装置,其特征在于,还包括;
获取模块,用于响应于当前用户浏览对象的操作,获取所述当前用户对应的各个兴趣标签;
第四确定模块,用于将所述当前用户对应的所有兴趣标签作为一个关键词组;
第五确定模块,用于分别确定所述关键词组与所述兴趣群组划分结果中每个兴趣群组的标题之间的相似度,其中,兴趣群组的标题由该兴趣群组对应的各个兴趣标签组成;
推荐模块,用于向所述当前用户推荐与所述关键词组的相似度超过第二阈值的兴趣群组。
17.一种计算机存储介质,其特征在于,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现权利要求1-8任一所述方法的步骤。
18.一种计算设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现权利要求1-8任一所述方法的步骤。
CN201711277641.1A 2017-12-06 2017-12-06 一种兴趣群组划分方法、装置、介质及计算设备 Active CN108287864B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711277641.1A CN108287864B (zh) 2017-12-06 2017-12-06 一种兴趣群组划分方法、装置、介质及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711277641.1A CN108287864B (zh) 2017-12-06 2017-12-06 一种兴趣群组划分方法、装置、介质及计算设备

Publications (2)

Publication Number Publication Date
CN108287864A CN108287864A (zh) 2018-07-17
CN108287864B true CN108287864B (zh) 2020-07-10

Family

ID=62831870

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711277641.1A Active CN108287864B (zh) 2017-12-06 2017-12-06 一种兴趣群组划分方法、装置、介质及计算设备

Country Status (1)

Country Link
CN (1) CN108287864B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111127064B (zh) * 2018-11-01 2023-08-25 百度在线网络技术(北京)有限公司 用户社会属性的确定方法、装置与电子设备
CN110033036B (zh) * 2019-04-04 2022-05-17 厦门小圈网络科技有限公司 一种基于圈子的社交关系分类方法
CN110297967B (zh) * 2019-05-14 2022-04-12 北京百度网讯科技有限公司 兴趣点确定方法、装置、设备及计算机可读存储介质
CN110555164B (zh) * 2019-07-23 2024-01-05 平安科技(深圳)有限公司 群体兴趣标签的生成方法、装置、计算机设备和存储介质
CN110659396B (zh) * 2019-08-14 2023-05-23 平安科技(深圳)有限公司 缺失属性信息补全方法、装置、计算机设备和存储介质
CN110659799A (zh) * 2019-08-14 2020-01-07 深圳壹账通智能科技有限公司 基于关系网络的属性信息处理方法、装置、计算机设备和存储介质
CN110659395B (zh) * 2019-08-14 2023-05-30 平安科技(深圳)有限公司 关系网络图谱构建方法、装置、计算机设备和存储介质
CN111565112B (zh) * 2020-04-30 2022-08-26 维沃移动通信有限公司 创建群组的方法、装置、电子设备及可读存储介质
CN111667018B (zh) * 2020-06-17 2023-12-15 腾讯科技(深圳)有限公司 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN111986314B (zh) * 2020-08-21 2022-08-16 浙江商汤科技开发有限公司 三维重建中的图像分组方法及装置、电子设备和存储介质
CN113763080A (zh) * 2020-08-26 2021-12-07 北京沃东天骏信息技术有限公司 推荐物品的确定方法、装置、电子设备和存储介质
CN112118551B (zh) * 2020-10-16 2022-09-09 同盾控股有限公司 设备风险识别方法及相关设备
CN112398725B (zh) * 2020-11-05 2022-05-31 中国联合网络通信集团有限公司 群消息提示方法、系统、计算机设备及存储介质
CN113111255A (zh) * 2021-03-25 2021-07-13 卓尔智联(武汉)研究院有限公司 用户群体划分方法、装置、电子设备及计算机存储介质
CN114118299A (zh) * 2021-12-10 2022-03-01 中国人民解放军国防科技大学 一种结合相似性度量和社区发现的聚类方法
CN114581693B (zh) * 2022-03-07 2023-11-03 支付宝(杭州)信息技术有限公司 一种用户行为模式的区分方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877711A (zh) * 2009-04-28 2010-11-03 华为技术有限公司 社会网络建立方法及装置、以及社区发现方法及装置
CN102609465A (zh) * 2012-01-16 2012-07-25 武汉大学 基于潜在社群的信息推荐方法
CN105427125A (zh) * 2015-10-29 2016-03-23 电子科技大学 基于商品网络连接图的商品簇划分方法
CN106452809A (zh) * 2015-08-04 2017-02-22 北京奇虎科技有限公司 一种数据处理方法和装置
CN106469413A (zh) * 2015-08-20 2017-03-01 深圳市腾讯计算机系统有限公司 一种虚拟资源的数据处理方法及装置
US9749406B1 (en) * 2013-03-13 2017-08-29 Hrl Laboratories, Llc System and methods for automated community discovery in networks with multiple relational types

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101877711A (zh) * 2009-04-28 2010-11-03 华为技术有限公司 社会网络建立方法及装置、以及社区发现方法及装置
CN102609465A (zh) * 2012-01-16 2012-07-25 武汉大学 基于潜在社群的信息推荐方法
US9749406B1 (en) * 2013-03-13 2017-08-29 Hrl Laboratories, Llc System and methods for automated community discovery in networks with multiple relational types
CN106452809A (zh) * 2015-08-04 2017-02-22 北京奇虎科技有限公司 一种数据处理方法和装置
CN106469413A (zh) * 2015-08-20 2017-03-01 深圳市腾讯计算机系统有限公司 一种虚拟资源的数据处理方法及装置
CN105427125A (zh) * 2015-10-29 2016-03-23 电子科技大学 基于商品网络连接图的商品簇划分方法

Also Published As

Publication number Publication date
CN108287864A (zh) 2018-07-17

Similar Documents

Publication Publication Date Title
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
US11314823B2 (en) Method and apparatus for expanding query
CN107330115B (zh) 一种信息推荐方法及装置
CN109241412B (zh) 一种基于网络表示学习的推荐方法、系统及电子设备
CN110334272B (zh) 基于知识图谱的智能问答方法、装置及计算机存储介质
CN109190049B (zh) 关键词推荐方法、系统、电子设备和计算机可读介质
CN108920527A (zh) 一种基于知识图谱的个性化推荐方法
CN107704503A (zh) 用户关键词提取装置、方法及计算机可读存储介质
Zhu et al. Popularity modeling for mobile apps: A sequential approach
US10459996B2 (en) Big data based cross-domain recommendation method and apparatus
CN111539197B (zh) 文本匹配方法和装置以及计算机系统和可读存储介质
CN109062914B (zh) 用户推荐方法和装置,存储介质和服务器
CN107609469B (zh) 社会网络关联用户挖掘方法及系统
CN111522886B (zh) 一种信息推荐方法、终端及存储介质
CN112101437A (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
CN110597962A (zh) 搜索结果展示方法、装置、介质及电子设备
CN110209810A (zh) 相似文本识别方法以及装置
CN112131261B (zh) 基于社区网络的社区查询方法、装置和计算机设备
CN116010684A (zh) 物品推荐方法、装置及存储介质
Bouneffouf Situation-aware approach to improve context-based recommender system
CN112948575A (zh) 文本数据处理方法、装置和计算机可读存储介质
CN111667018B (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN109829110A (zh) 一种学习资料的个性化推荐方法
CN104077288A (zh) 网页内容推荐方法和网页内容推荐设备
CN111242239A (zh) 一种训练样本选取方法、装置、以及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant