CN108319628A - 一种用户兴趣确定方法及装置 - Google Patents

一种用户兴趣确定方法及装置 Download PDF

Info

Publication number
CN108319628A
CN108319628A CN201710097333.4A CN201710097333A CN108319628A CN 108319628 A CN108319628 A CN 108319628A CN 201710097333 A CN201710097333 A CN 201710097333A CN 108319628 A CN108319628 A CN 108319628A
Authority
CN
China
Prior art keywords
interest
user
frequent
item
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710097333.4A
Other languages
English (en)
Other versions
CN108319628B (zh
Inventor
孔蓓蓓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201710097333.4A priority Critical patent/CN108319628B/zh
Publication of CN108319628A publication Critical patent/CN108319628A/zh
Application granted granted Critical
Publication of CN108319628B publication Critical patent/CN108319628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种用户兴趣确定方法,包括:获取多个用户的行为日志数据;根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;从所述频繁兴趣集中获取所述目标用户的潜在兴趣。本发明实施例还公开了一种用户兴趣确定装置。采用本发明实施例,可以更加全面的挖掘用户兴趣方向,进而提高个性化推荐的精确性。

Description

一种用户兴趣确定方法及装置
技术领域
本发明涉及电子技术领域,尤其涉及一种用户兴趣确定方法及装置。
背景技术
随着网络信息资源的快速增长,互联网已经成为人们不可或缺的信息来源。然而,相对于巨大、无序的互联网信息空间,每个用户真正需要的信息非常有限,仅仅是互联网信息空间的沧海一粟。海量的信息资源供给和有限的目标资源需求之间的矛盾,使得我们必须寻求一种能够快速、准确地从浩瀚的信息资源中找到所需信息的方法。正是在这样的需求驱动下,个性化服务技术得到了长足的发展,成为了当前信息服务领域的研究热点之一。用户兴趣建模是个性化服务技术的核心内容。用户模型能否准确地反映用户的兴趣决定了个性化服务系统所提供的服务质量的优劣。其中,用户兴趣建模是指根据用户提供的信息(例如,用户浏览内容、浏览行为、基本信息)归纳出用户兴趣。
在现有技术方案中,第一,主题表示法主要是以用户感兴趣的信息主题来表示用户的兴趣特征。例如,用户对新闻和体育类信息感兴趣,则用户描述文件表示为(新闻、体育),这种表示法往往与具体的应用领域相结合。第二,关键词列表法是指以用户感兴趣信息的关键词来描述用户的兴趣特征,如图1所示,用户对篮球感兴趣,则用户描述文件可以表示为(NBA、火箭、科比)等,关键词可以由用户指定,也可以通过学习算法得到。
但是,由于现有技术方案只是通过统计学的方法,利用资源访问量的高低来建立用户模型,使得用户兴趣的范畴受到了资源访问范畴的影响,无法推理出资源访问范畴以外的潜在用户兴趣,导致随着资源访问量的增加,用户兴趣模型很难发生改变,推荐资源迅速收敛,不能及时地满足描述用户兴趣转变的要求,影响资源推荐的效果和精确性。
发明内容
本发明实施例提供一种用户兴趣确定方法及装置。可以解决用户兴趣挖掘不全面的技术问题。
本发明第一方面提供了一种用户兴趣确定方法,包括:
获取多个用户的行为日志数据;
根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;
根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;
从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
其中,所述根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集包括:
根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;
根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
其中,所述根据所述每个用户的概念兴趣集合,确定候选频繁N项集包括:
获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;
根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;
对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
其中,所述根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集包括:
确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;
当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,则将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
其中,所述从所述频繁兴趣集中获取所述目标用户的潜在兴趣之后,还包括:
获取所述目标用户对所述潜在兴趣的关注时间间隔和关注频率、以及预设的衰减因子;
根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度。
其中,所述根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度之后,还包括:
判断所述目标用户对所述潜在兴趣的关注度是否小于第二预设阈值;
当所述目标用户对所述潜在兴趣的关注度小于所述第二预设阈值时,从所述频繁兴趣集中删除所述潜在兴趣。
相应地,本发明第二方面提供了一种用户兴趣确定装置,包括:
数据获取模块,用于获取多个用户的行为日志数据;
数据确定模块,用于根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;
关联计算模块,用于根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;
兴趣确定模块,用于从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
其中,所述关联计算模块具体用于:
根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;
根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
其中,所述关联计算模块具体用于:
获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;
根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;
对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
其中,所述关联计算模块具体用于:
确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;
当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,则将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
其中,所述装置还包括:
关注度计算模块,用于获取所述目标用户对所述潜在兴趣的关注时间间隔和关注频率、以及预设的衰减因子;根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度。
其中,所述关注度计算模块,还用于判断所述目标用户对所述潜在兴趣的关注度是否小于第二预设阈值;当所述目标用户对所述潜在兴趣的关注度小于所述第二预设阈值时,从所述频繁兴趣集中删除所述潜在兴趣。
相应地,本发明第三方面提供了一种用户兴趣确定装置,所述装置包括接口电路、存储器以及处理器,其中,所述存储器中存储一组程序代码,且所述处理器用于调用所述存储器中存储的程序代码,用于执行以下操作:
获取多个用户的行为日志数据;
根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;
根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;
从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
实施本发明实施例,首先获取多个用户的行为日志数据;然后根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,其次根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;最后从所述频繁兴趣集中获取所述目标用户的潜在兴趣。本发明通过关联规则确定用户的潜在兴趣,从而可以更加全面的挖掘用户兴趣方向,进而提高个性化推荐的精确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是现有技术方案提供的一种用户兴趣确定方法的流程示意图;
图2是本发明实施例提供的一种用户兴趣挖掘模型的架构图;
图3是本发明实施例提供的一种用户兴趣确定方法的流程示意图;
图4(A)是本发明实施例提供的一种频繁兴趣集的挖掘流程示意图;
图4(B)是本发明实施例提供的另一种频繁兴趣集的挖掘流程示意图;
图4(C)是本发明实施例提供的另一种频繁兴趣集的挖掘流程示意图;
图5是本发明另一实施例提供的一种用户兴趣确定方法的流程示意图;
图6是本发明实施例提供的一种用户兴趣确定装置的结构示意图;
图7是本发明实施例提供的另一种用户兴趣确定装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图2所示,图2是本发明实施例提供的一种用户兴趣挖掘模型的架构图。包括行为记录模块、兴趣领域本体、兴趣挖掘模块和兴趣打分模型。其中,行为记录模块负责通过用户的搜索、阅读和使用app的行为所形成的日志文件进行收集,形成比较实体的用户兴趣范围,用以领域本体进行查询,对于用户兴趣模型而言,行为记录是用户兴趣的基础。兴趣领域本体用于兴趣的描述,将每个兴趣通过某一概念组合来表示,行为记录转化为概念兴趣串。兴趣挖掘模块用于通过改进的关联规则将行为记录和兴趣本体模块所形成的概念兴趣串,形成无冗余、无重复的、可表示用户长期兴趣方向的概念频繁兴趣簇,然后从概念兴趣串挖掘出用户的潜在的即使兴趣。兴趣打分模型用于对用户的潜在兴趣进行打分,当判决潜在兴趣的关注度低于该阈值的时,将该潜在兴趣从用户长期兴趣模型中消除。通过上述模型可以更加全面的挖掘用户兴趣,建立用户画像,并将该模型应用于个性化推荐系统,进而提高向用户推荐信息的精确性。以下通过具体的实施例进行说明。
请参考图3,图3是本发明实施例提供的一种用户兴趣确定方法的流程示意图,如图所示,本发明实施例中的方法包括:
S301,获取多个用户的行为日志数据。
具体实现中,可以对用户搜索、用户阅读或/和使用应用的行为所形成的日志文件进行收集,形成比较实体的用户兴趣范围。进一步的,可以按照预设的时间间隔内获取多个用户的行为日志数据,其中,行为日志数据可以包括用户关注次数、关注时间间隔和关注时长等等,预设时间间隔可以包括但不限于半个月或1个月。
例如,可以每隔一个月收集用户对用户终端中已安装应用的使用情况,分别记录每个已安装应用的应用类别(如,购物、体育、新闻等等),并分别统计每个已安装应用的使用次数,或者获取用户的阅读信息,提取阅读信息中的关键词,根据关键词判断信息类型,并分别每种信息类型的阅读次数或阅读时长。
S302,根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量。
具体实现中,可以对行为日志数据进行分析,提取所述行为日志数据中的关键词,进而确定用户兴趣,然后根据用户对该兴趣的关注次数、关注时间间隔或/和关注时长,计算用户对该兴趣的关注概率,最后将用户兴趣以及对该兴趣的关注概率组合成一个概念兴趣集合,其中,关注概率作为兴趣标识向量的大小。例如,用户A(游戏:0.8,交友:0.6,外卖:0.6),用户B(游戏:0.8,外卖:0.6,颈椎知识:0.5)。
S303,根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣。
具体实现中,可以根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
进一步的,可以获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
进一步的,可以确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
如图4(A)所示,数据库包括:用户1有兴趣A、兴趣B和兴趣C、用户2有兴趣B、兴趣C和兴趣E,用户3有兴趣A、兴趣B、兴趣C和兴趣E,用户4有兴趣B和兴趣E。为了方便说明,将每个用户的每个兴趣标识向量的大小均看作1。扫描数据库确定4个用户所有的兴趣包括兴趣A、兴趣B、兴趣C、兴趣D和兴趣E,因此,将兴趣A、兴趣B、兴趣C、兴趣D和兴趣E组合成一个候选频繁1项集,其中,由于用户1和用户3同时支持兴趣A,因此兴趣A的支持度为25%;由于用户2、用户3、用户4同时支持兴趣B,因此兴趣B的支持度为75%,按照此方法依次得到的兴趣C的支持度为75%、兴趣D的支持度为25%和兴趣E的支持度为75%。然后对所述候选频繁1项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁1项集,包括兴趣A、兴趣B、兴趣C和兴趣E。
如图4(B)所示,根据频繁1项集得到候选频繁2项集,频繁1项集中包括兴趣A、兴趣B、兴趣C和兴趣E,分别对频繁1项集中兴趣A、兴趣B、兴趣C和兴趣E进行二项组合得到候选频繁2项集,包括兴趣A和兴趣B组合、兴趣A和兴趣C组合、兴趣A和兴趣E组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合。由于只有用户3支持兴趣A和兴趣B组合,因此兴趣A和兴趣B的支持度为25%,由于用户1和用户3同时支持兴趣A和兴趣C组合,因此兴趣A和兴趣C的组合的支持度为50%,按照此方法依次得到兴趣A和兴趣E组合的支持度为25%,兴趣B和兴趣C组合的支持度为50%,兴趣B和兴趣C组合的支持度为50%,兴趣B和兴趣E组合的支持度为75%,兴趣C和兴趣E组合的支持度为50%。然后对所述候选频繁2项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁2项集,包括兴趣A和兴趣C组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合。
如图4(C)所示,根据频繁2项集得到候选频繁3项集,频繁2项集包括兴趣A和兴趣C组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合,分别对频繁2项集中的兴趣A、兴趣B、兴趣C和兴趣E进行三项组合得到候选频繁3项集,得到兴趣A、兴趣B和兴趣C组合,兴趣A、兴趣B和兴趣E组合,兴趣A、兴趣C和兴趣E组合,兴趣B、兴趣C和兴趣E组合。由于只有用户3支持兴趣A、兴趣B和兴趣C组合,因此兴趣A、兴趣B和兴趣C组合支持度为25%,由于只有用户3支持兴趣A、兴趣B和兴趣E组合,因此兴趣A、兴趣B和兴趣E组合支持度为25%,因此按照此方法得到兴趣A、兴趣C和兴趣E组合支持度为25%,兴趣B、兴趣C和兴趣E组合支持度为50%,然后对所述候选频繁3项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁3项集,包括兴趣B、兴趣C和兴趣E组合。由于所述候选频繁3项集中仅存在一个大于所述预设阈值的频繁项集(兴趣B、兴趣C和兴趣E组合),因此最终将兴趣B、兴趣C和兴趣E组合作为所述频繁兴趣集。
S304,从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
例如,用户1原有兴趣包括兴趣A、兴趣C和兴趣D,频繁兴趣集中包括兴趣B、兴趣C和兴趣E组合,因此,用户1的潜在兴趣包括兴趣B和兴趣E。又如,用户2的原有兴趣包括兴趣B、兴趣C和兴趣E组合,而频繁兴趣集中包括兴趣B、兴趣C和兴趣E组合,因此用户1不存在潜在兴趣。
可选的,可以根据目标用户的潜在兴趣查询与潜在兴趣相关的数据信息,并向用户终端推荐查询的到与潜在兴趣相关的数据信息,从而更加精准的进行个性化推荐。
在本发明实施例中,首先获取多个用户的行为日志数据;然后根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,其次根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;最后从所述频繁兴趣集中获取所述目标用户的潜在兴趣。本发明通过关联规则确定用户的潜在兴趣,从而可以更加全面的挖掘用户兴趣方向,进而提高个性化推荐的精确性。
请参考图5,图5是本发明另一实施例提供的一种用户兴趣确定方法的流程示意图,如图所示,本发明实施例中的方法包括:
S501,获取多个用户的行为日志数据。
具体实现中,可以对用户搜索、用户阅读或/和使用应用的行为所形成的日志文件进行收集,形成比较实体的用户兴趣范围。进一步的,可以按照预设的时间间隔内获取多个用户的行为日志数据,其中,行为日志数据可以包括用户关注次数、关注时间间隔和关注时长等等,预设时间间隔可以包括但不限于半个月或1个月。
例如,可以每隔一个月收集用户对用户终端中已安装应用的使用情况,分别记录每个已安装应用的应用类别(如,购物、体育、新闻等等),并分别统计每个已安装应用的使用次数,或者获取用户的阅读信息,提取阅读信息中的关键词,根据关键词判断信息类型,并分别每种信息类型的阅读次数或阅读时长。
S502,根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量。
具体实现中,可以对行为日志数据进行分析,提取所述行为日志数据中的关键词,进而确定用户兴趣,然后根据用户对该兴趣的关注次数、关注时间间隔或关注时长,计算用户对该兴趣的关注概率,最后将用户兴趣以及对该兴趣的关注概率组合成一个概念兴趣集合,其中,关注概率作为兴趣标识向量的大小。例如,用户A(游戏:0.8,交友:0.6,外卖:0.6),用户B(游戏:0.8,外卖:0.6,颈椎知识:0.5)。
S503,根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣。
具体实现中,可以根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
进一步的,可以获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
进一步的,可以确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
如图4(A)所示,数据库包括:用户1有兴趣A、兴趣B和兴趣C、用户2有兴趣B、兴趣C和兴趣E,用户3有兴趣A、兴趣B、兴趣C和兴趣E,用户4有兴趣B和兴趣E。为了方便说明,将每个用户的每个兴趣标识向量的大小均看作1。扫描数据库确定4个用户所有的兴趣包括兴趣A、兴趣B、兴趣C、兴趣D和兴趣E,因此,将兴趣A、兴趣B、兴趣C、兴趣D和兴趣E组合成一个候选频繁1项集,其中,由于用户1和用户3同时支持兴趣A,因此兴趣A的支持度为25%;由于用户2、用户3、用户4同时支持兴趣B,因此兴趣B的支持度为75%,按照此方法依次得到的兴趣C的支持度为75%、兴趣D的支持度为25%和兴趣E的支持度为75%。然后对所述候选频繁1项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁1项集,包括兴趣A、兴趣B、兴趣C和兴趣E。
如图4(B)所示,根据频繁1项集得到候选频繁2项集,频繁1项集中包括兴趣A、兴趣B、兴趣C和兴趣E,分别对频繁1项集中兴趣A、兴趣B、兴趣C和兴趣E进行二项组合得到候选频繁2项集,包括兴趣A和兴趣B组合、兴趣A和兴趣C组合、兴趣A和兴趣E组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合。由于只有用户3支持兴趣A和兴趣B组合,因此兴趣A和兴趣B的支持度为25%,由于用户1和用户3同时支持兴趣A和兴趣C组合,因此兴趣A和兴趣C的组合的支持度为50%,按照此方法依次得到兴趣A和兴趣E组合的支持度为25%,兴趣B和兴趣C组合的支持度为50%,兴趣B和兴趣C组合的支持度为50%,兴趣B和兴趣E组合的支持度为75%,兴趣C和兴趣E组合的支持度为50%。然后对所述候选频繁2项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁2项集,包括兴趣A和兴趣C组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合。
如图4(C)所示,根据频繁2项集得到候选频繁3项集,频繁2项集包括兴趣A和兴趣C组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合,分别对频繁2项集中的兴趣A、兴趣B、兴趣C和兴趣E进行三项组合得到候选频繁3项集,得到兴趣A、兴趣B和兴趣C组合,兴趣A、兴趣B和兴趣E组合,兴趣A、兴趣C和兴趣E组合,兴趣B、兴趣C和兴趣E组合。由于只有用户3支持兴趣A、兴趣B和兴趣C组合,因此兴趣A、兴趣B和兴趣C组合支持度为25%,由于只有用户3支持兴趣A、兴趣B和兴趣E组合,因此兴趣A、兴趣B和兴趣E组合支持度为25%,因此按照此方法得到兴趣A、兴趣C和兴趣E组合支持度为25%,兴趣B、兴趣C和兴趣E组合支持度为50%,然后对所述候选频繁3项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁3项集,包括兴趣B、兴趣C和兴趣E组合。由于所述候选频繁3项集中仅存在一个大于所述预设阈值的频繁项集(兴趣B、兴趣C和兴趣E组合),因此最终将兴趣B、兴趣C和兴趣E组合作为所述频繁兴趣集。
S504,从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
例如,用户1原有兴趣包括兴趣A、兴趣C和兴趣D,频繁兴趣集中包括兴趣B、兴趣C和兴趣E组合,因此,用户1的潜在兴趣包括兴趣B和兴趣E。又如,用户2的原有兴趣包括兴趣B、兴趣C和兴趣E组合,而频繁兴趣集中包括兴趣B、兴趣C和兴趣E组合,因此用户1不存在潜在兴趣。
S505,获取所述目标用户对所述潜在兴趣的关注时间间隔和关注频率、以及预设的衰减因子。
需要说明的,用户的兴趣都有一定的时间性,随时间周期的推移对某些兴趣的关注度可能会降低,对某些兴趣的关注度反而会提高。而关注度提高兴趣会反应在用户兴趣增量模型中,关注度降低的兴趣引入一个衰减因子θ,按照衰减因子θ进行衰减来描述用户对兴趣的关注度降低过程,同时根据兴趣的属性和挖掘特征来源分别加入影响因子,例如关注时间间隔和关注频率等等。
S506,根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度。
具体实现中,潜在兴趣的关注度其中,time为关注时间间隔,freq为关注频率,θ为衰减因子。
S507,判断所述目标用户对所述潜在兴趣的关注度是否小于第二预设阈值。
S508,当所述目标用户对所述潜在兴趣的关注度小于所述第二预设阈值时,从所述频繁兴趣集中删除所述潜在兴趣。
具体实现中,随着长期用户兴趣模型的不断更新,有些兴趣在用户长期不关注的情况下,会发生很大程度的衰减,说明用户对该潜在兴趣失去关注,因此设定一个关注度的最低阈值c,当某潜在兴趣的关注度低于该阈值的时候,将直接从用户长期兴趣模型中删除。
请参考图6,图6是本发明实施例提供的一种用户兴趣确认装置的结构示意图。如图所示,本发明实施例中的装置包括:
数据获取模块601,用于获取多个用户的行为日志数据。
具体实现中,可以对用户搜索、用户阅读或/和使用应用的行为所形成的日志文件进行收集,形成比较实体的用户兴趣范围。进一步的,可以按照预设的时间间隔内获取多个用户的行为日志数据,其中,行为日志数据可以包括用户关注次数、关注时间间隔和关注时长等等,预设时间间隔可以包括但不限于半个月或1个月。
例如,可以每隔一个月收集用户对用户终端中已安装应用的使用情况,分别记录每个已安装应用的应用类别(如,购物、体育、新闻等等),并分别统计每个已安装应用的使用次数,或者获取用户的阅读信息,提取阅读信息中的关键词,根据关键词判断信息类型,并分别每种信息类型的阅读次数或阅读时长。
数据确定模块602,用于根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量。
具体实现中,可以对行为日志数据进行分析,提取所述行为日志数据中的关键词,进而确定用户兴趣,然后根据用户对该兴趣的关注次数、关注时间间隔或关注时长,计算用户对该兴趣的关注概率,最后将用户兴趣以及对该兴趣的关注概率组合成一个概念兴趣集合,其中,关注概率作为兴趣标识向量的大小。例如,用户A(游戏:0.8,交友:0.6,外卖:0.6),用户B(游戏:0.8,外卖:0.6,颈椎知识:0.5)。
关联计算模块603,用于根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣。
具体实现中,可以根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
进一步的,可以获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
进一步的,可以确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
如图4(A)所示,数据库包括:用户1有兴趣A、兴趣B和兴趣C、用户2有兴趣B、兴趣C和兴趣E,用户3有兴趣A、兴趣B、兴趣C和兴趣E,用户4有兴趣B和兴趣E。为了方便说明,将每个用户的每个兴趣标识向量的大小均看作1。扫描数据库确定4个用户所有的兴趣包括兴趣A、兴趣B、兴趣C、兴趣D和兴趣E,因此,将兴趣A、兴趣B、兴趣C、兴趣D和兴趣E组合成一个候选频繁1项集,其中,由于用户1和用户3同时支持兴趣A,因此兴趣A的支持度为25%;由于用户2、用户3、用户4同时支持兴趣B,因此兴趣B的支持度为75%,按照此方法依次得到的兴趣C的支持度为75%、兴趣D的支持度为25%和兴趣E的支持度为75%。然后对所述候选频繁1项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁1项集,包括兴趣A、兴趣B、兴趣C和兴趣E。
如图4(B)所示,根据频繁1项集得到候选频繁2项集,频繁1项集中包括兴趣A、兴趣B、兴趣C和兴趣E,分别对频繁1项集中兴趣A、兴趣B、兴趣C和兴趣E进行二项组合得到候选频繁2项集,包括兴趣A和兴趣B组合、兴趣A和兴趣C组合、兴趣A和兴趣E组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合。由于只有用户3支持兴趣A和兴趣B组合,因此兴趣A和兴趣B的支持度为25%,由于用户1和用户3同时支持兴趣A和兴趣C组合,因此兴趣A和兴趣C的组合的支持度为50%,按照此方法依次得到兴趣A和兴趣E组合的支持度为25%,兴趣B和兴趣C组合的支持度为50%,兴趣B和兴趣C组合的支持度为50%,兴趣B和兴趣E组合的支持度为75%,兴趣C和兴趣E组合的支持度为50%。然后对所述候选频繁2项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁2项集,包括兴趣A和兴趣C组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合。
如图4(C)所示,根据频繁2项集得到候选频繁3项集,频繁2项集包括兴趣A和兴趣C组合、兴趣B和兴趣C组合、兴趣B和兴趣E组合、兴趣C和兴趣E组合,分别对频繁2项集中的兴趣A、兴趣B、兴趣C和兴趣E进行三项组合得到候选频繁3项集,得到兴趣A、兴趣B和兴趣C组合,兴趣A、兴趣B和兴趣E组合,兴趣A、兴趣C和兴趣E组合,兴趣B、兴趣C和兴趣E组合。由于只有用户3支持兴趣A、兴趣B和兴趣C组合,因此兴趣A、兴趣B和兴趣C组合支持度为25%,由于只有用户3支持兴趣A、兴趣B和兴趣E组合,因此兴趣A、兴趣B和兴趣E组合支持度为25%,因此按照此方法得到兴趣A、兴趣C和兴趣E组合支持度为25%,兴趣B、兴趣C和兴趣E组合支持度为50%,然后对所述候选频繁3项集中的频繁项集进行筛选,将每个频繁项集与预设阈值(如,50%)进行比较,删除小于预设阈值的频繁项集,得到频繁3项集,包括兴趣B、兴趣C和兴趣E组合。由于所述候选频繁3项集中仅存在一个大于所述预设阈值的频繁项集(兴趣B、兴趣C和兴趣E组合),因此最终将兴趣B、兴趣C和兴趣E组合作为所述频繁兴趣集。
兴趣确定模块604,用于从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
例如,用户1原有兴趣包括兴趣A、兴趣C和兴趣D,频繁兴趣集中包括兴趣B、兴趣C和兴趣E组合,因此,用户1的潜在兴趣包括兴趣B和兴趣E。又如,用户2的原有兴趣包括兴趣B、兴趣C和兴趣E组合,而频繁兴趣集中包括兴趣B、兴趣C和兴趣E组合,因此用户1不存在潜在兴趣。
可选的,如图6所示,本发明实施例中的装置还包括:
关注度计算模块605,用于获取所述目标用户对所述潜在兴趣的关注时间间隔和关注频率、以及预设的衰减因子;根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度。
需要说明的,用户的兴趣都有一定的时间性,随时间周期的推移对某些兴趣的关注度可能会降低,对某些兴趣的关注度反而会提高。而关注度提高兴趣会反应在用户兴趣增量模型中,关注度降低的兴趣引入一个衰减因子θ,按照衰减因子θ进行衰减来描述用户对兴趣的关注度降低过程,同时根据兴趣的属性和挖掘特征来源分别加入影响因子,例如关注时间间隔和关注频率等等。
其中,潜在兴趣的关注度其中,time为关注时间间隔,freq为关注频率,θ为衰减因子。
关注度计算模块605,还用于判断所述目标用户对所述潜在兴趣的关注度是否小于第二预设阈值;当所述目标用户对所述潜在兴趣的关注度小于所述第二预设阈值时,从所述频繁兴趣集中删除所述潜在兴趣。
具体实现中,随着长期用户兴趣模型的不断更新,有些兴趣在用户长期不关注的情况下,会发生很大程度的衰减,说明用户对该潜在兴趣失去关注,因此设定一个关注度的最低阈值c,当某潜在兴趣的关注度低于该阈值的时候,将直接从用户长期兴趣模型中删除。
请参考图7,图7是本发明另一实施例提供的一种用户兴趣确认装置的结构示意图。如图所示,该装置可以包括:至少一个处理器701,例如CPU,至少一个通信接口702,至少一个存储器703,至少一个总线707。其中,总线707用于实现这些组件之间的连接通信。其中,本发明实施例中装置的通信接口702是有线发送端口,也可以为无线设备,例如包括天线装置,用于与其他节点设备进行信令或数据的通信。存储器703可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器703可选的还可以是至少一个位于远离前述处理器701的存储装置。存储器703中存储一组程序代码,且处理器701用于调用存储器中存储的程序代码,用于执行以下操作:
获取多个用户的行为日志数据;
根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;
根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;
从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
其中,处理器701还用于执行如下操作步骤:
根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;
根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
其中,处理器701还用于执行如下操作步骤:
获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;
根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;
对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
其中,处理器701还用于执行如下操作步骤:
确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;
当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
其中,处理器701还用于执行如下操作步骤:
获取所述目标用户对所述潜在兴趣的关注时间间隔和关注频率、以及预设的衰减因子;
根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度。
其中,处理器701还用于执行如下操作步骤:
判断所述目标用户对所述潜在兴趣的关注度是否小于第二预设阈值;
当所述目标用户对所述潜在兴趣的关注度小于所述第二预设阈值时,从所述频繁兴趣集中删除所述潜在兴趣。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本发明实施例所提供的内容下载方法及相关设备、系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (13)

1.一种用户兴趣确定方法,其特征在于,所述方法包括:
获取多个用户的行为日志数据;
根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;
根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;
从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
2.如权利要求1所述的方法,其特征在于,所述根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集包括:
根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;
根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
3.如权利要求2所述的方法,其特征在于,所述根据所述每个用户的概念兴趣集合,确定候选频繁N项集包括:
获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;
根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;
对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
4.如权利要求2所述的方法,其特征在于,所述根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集包括:
确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;
当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
5.如权利要求1-4任意一项所述的方法,其特征在于,所述从所述频繁兴趣集中获取所述目标用户的潜在兴趣之后,还包括:
获取所述目标用户对所述潜在兴趣的关注时间间隔和关注频率、以及预设的衰减因子;
根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度。
6.如权利要求5所述的方法,其特征在于,所述根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度之后,还包括:
判断所述目标用户对所述潜在兴趣的关注度是否小于第二预设阈值;
当所述目标用户对所述潜在兴趣的关注度小于所述第二预设阈值时,从所述频繁兴趣集中删除所述潜在兴趣。
7.一种用户兴趣确定装置,其特征在于,所述装置包括:
数据获取模块,用于获取多个用户的行为日志数据;
数据确定模块,用于根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;
关联计算模块,用于根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;
兴趣确定模块,用于从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
8.如权利要求7所述的方法,其特征在于,所述关联计算模块具体用于:
根据所述每个用户的概念兴趣集合,确定候选频繁N项集,并计算所述候选频繁N项集中每个频繁项集的支持度,所述N为大于1的正整数;
根据所述候选频繁N项集中的每个频繁项集的支持度,选取所述候选频繁N项集的目标频繁项集作为所述频繁兴趣集。
9.如权利要求8所述的装置,其特征在于,所述关联计算模块具体用于:
获取候选频繁N-1项集以及所述候选频繁N-1项集中每个频繁项集的支持度;
根据所述候选频繁N-1项集中每个频繁项集的支持度,对所述候选频繁N-1项集中的频繁项集进行筛选;
对经过筛选的所述候选频繁N-1项集中的频繁项集进行组合得到所述候选频繁N项集。
10.如权利要求8所述的装置,其特征在于,所述关联计算模块具体用于:
确定所述候选频繁N项集中的每个频繁项集的支持度是否大于第一预设阈值;
当所述候选频繁N项集中仅存在一个大于所述第一预设阈值的频繁项集时,将所述大于所述第一预设阈值的频繁项集作为所述频繁兴趣集。
11.如权利要求7-10任意一项所述的装置,其特征在于,所述装置还包括:
关注度计算模块,用于获取所述目标用户对所述潜在兴趣的关注时间间隔和关注频率、以及预设的衰减因子;根据所述关注时间间隔、所述关注频率和所述预设的衰减因子,计算所述目标用户对所述潜在兴趣的关注度。
12.如权利要求11所述的装置,其特征在于,
所述关注度计算模块,还用于判断所述目标用户对所述潜在兴趣的关注度是否小于第二预设阈值;当所述目标用户对所述潜在兴趣的关注度小于所述第二预设阈值时,从所述频繁兴趣集中删除所述潜在兴趣。
13.一种用户兴趣确定装置,其特征在于,所述装置包括接口电路、存储器以及处理器,其中,所述存储器中存储一组程序代码,且所述处理器用于调用所述存储器中存储的程序代码,用于执行以下操作:
获取多个用户的行为日志数据;
根据所述多个用户的行为日志数据,确定所述多个用户中每个用户的概念兴趣集合,所述概念兴趣集合包括至少一种兴趣标识向量;
根据所述每个用户的概念兴趣集合,通过关联规则计算所述多个用户之间的频繁兴趣集,所述频繁兴趣集包括所述多个用户中目标用户的原有兴趣和潜在兴趣;
从所述频繁兴趣集中获取所述目标用户的潜在兴趣。
CN201710097333.4A 2017-02-22 2017-02-22 一种用户兴趣确定方法及装置 Active CN108319628B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710097333.4A CN108319628B (zh) 2017-02-22 2017-02-22 一种用户兴趣确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710097333.4A CN108319628B (zh) 2017-02-22 2017-02-22 一种用户兴趣确定方法及装置

Publications (2)

Publication Number Publication Date
CN108319628A true CN108319628A (zh) 2018-07-24
CN108319628B CN108319628B (zh) 2022-04-22

Family

ID=62892938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710097333.4A Active CN108319628B (zh) 2017-02-22 2017-02-22 一种用户兴趣确定方法及装置

Country Status (1)

Country Link
CN (1) CN108319628B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457576A (zh) * 2019-07-08 2019-11-15 深圳壹账通智能科技有限公司 账户分类方法、装置、计算机设备和存储介质
CN111160977A (zh) * 2019-12-31 2020-05-15 中国移动通信集团黑龙江有限公司 用户关系兴趣特征图的获取方法、装置、设备及介质
CN111756832A (zh) * 2020-06-22 2020-10-09 百度在线网络技术(北京)有限公司 推送信息的方法、装置、电子设备及计算机可读存储介质
CN111950657A (zh) * 2020-08-26 2020-11-17 上海数鸣人工智能科技有限公司 一种dpi聚类及用户扩量方法
CN113946755A (zh) * 2021-10-29 2022-01-18 平安科技(深圳)有限公司 基于关联规则的信息推送方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750336A (zh) * 2012-06-04 2012-10-24 电子科技大学 一种基于用户关联性的资源个性化推荐方法
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统
CN103533390A (zh) * 2012-11-15 2014-01-22 Tcl集团股份有限公司 基于社交网络信息进行电视节目推荐的方法及系统
CN103731738A (zh) * 2014-01-23 2014-04-16 哈尔滨理工大学 基于用户群组行为分析的视频推荐方法及装置
CN103838804A (zh) * 2013-05-09 2014-06-04 电子科技大学 一种基于社团划分的社交网络用户兴趣关联规则挖掘方法
CN105022760A (zh) * 2014-04-30 2015-11-04 深圳市腾讯计算机系统有限公司 一种新闻推荐方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750336A (zh) * 2012-06-04 2012-10-24 电子科技大学 一种基于用户关联性的资源个性化推荐方法
CN103533390A (zh) * 2012-11-15 2014-01-22 Tcl集团股份有限公司 基于社交网络信息进行电视节目推荐的方法及系统
CN103198418A (zh) * 2013-03-15 2013-07-10 北京亿赞普网络技术有限公司 一种应用推荐方法和系统
CN103838804A (zh) * 2013-05-09 2014-06-04 电子科技大学 一种基于社团划分的社交网络用户兴趣关联规则挖掘方法
CN103731738A (zh) * 2014-01-23 2014-04-16 哈尔滨理工大学 基于用户群组行为分析的视频推荐方法及装置
CN105022760A (zh) * 2014-04-30 2015-11-04 深圳市腾讯计算机系统有限公司 一种新闻推荐方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457576A (zh) * 2019-07-08 2019-11-15 深圳壹账通智能科技有限公司 账户分类方法、装置、计算机设备和存储介质
CN111160977A (zh) * 2019-12-31 2020-05-15 中国移动通信集团黑龙江有限公司 用户关系兴趣特征图的获取方法、装置、设备及介质
CN111756832A (zh) * 2020-06-22 2020-10-09 百度在线网络技术(北京)有限公司 推送信息的方法、装置、电子设备及计算机可读存储介质
CN111950657A (zh) * 2020-08-26 2020-11-17 上海数鸣人工智能科技有限公司 一种dpi聚类及用户扩量方法
CN113946755A (zh) * 2021-10-29 2022-01-18 平安科技(深圳)有限公司 基于关联规则的信息推送方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN108319628B (zh) 2022-04-22

Similar Documents

Publication Publication Date Title
US10572565B2 (en) User behavior models based on source domain
CN108319628A (zh) 一种用户兴趣确定方法及装置
CN109508419B (zh) 一种基于知识学习的推荐方法和系统
CN105431844B (zh) 用于搜索系统的第三方搜索应用
US9552399B1 (en) Displaying information about distributed group discussions
CN105335491B (zh) 基于用户点击行为来向用户推荐图书的方法和系统
CN112765373B (zh) 资源推荐方法、装置、电子设备和存储介质
KR102015235B1 (ko) 경로조회 방법, 장치, 디바이스 및 비휘발성 컴퓨터 기억 매체
CN107872534B (zh) 信息推送方法、装置、服务器及可读存储介质
CN103136253A (zh) 获取信息的方法和装置
KR20150067897A (ko) 소셜 데이터의 인기도 예측 장치 및 방법
CN112749326A (zh) 信息处理方法、装置、计算机设备及存储介质
CN102222098A (zh) 一种网页预取方法和系统
CN109903086A (zh) 一种相似人群扩展方法、装置及电子设备
CN106156098B (zh) 一种纠错对挖掘方法及系统
WO2013110357A1 (en) Social network analysis
CN108334508A (zh) 网页信息的提取方法和装置
WO2022007626A1 (zh) 视频内容推荐方法、装置及计算机设备
CN110633406A (zh) 事件专题的生成方法、装置、存储介质和终端设备
CN108259547A (zh) 消息推送方法、设备及可编程设备
CN112989169A (zh) 目标对象识别方法、信息推荐方法、装置、设备及介质
CN112000763A (zh) 兴趣点竞争关系确定方法、装置、设备和介质
Wang et al. ST-SAGE: A spatial-temporal sparse additive generative model for spatial item recommendation
CN103262079B (zh) 检索装置及检索方法
CN113312563B (zh) 信息推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant