CN108664654A - 一种基于用户相似度的主播推荐方法及装置 - Google Patents
一种基于用户相似度的主播推荐方法及装置 Download PDFInfo
- Publication number
- CN108664654A CN108664654A CN201810478899.6A CN201810478899A CN108664654A CN 108664654 A CN108664654 A CN 108664654A CN 201810478899 A CN201810478899 A CN 201810478899A CN 108664654 A CN108664654 A CN 108664654A
- Authority
- CN
- China
- Prior art keywords
- user
- main broadcaster
- target user
- core customer
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 239000013598 vector Substances 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 6
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims description 3
- 239000010931 gold Substances 0.000 claims description 3
- 229910052737 gold Inorganic materials 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 41
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 108010001267 Protein Subunits Proteins 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于用户相似度的主播推荐方法及装置,通过计算直播平台中每个核心用户对每个主播的偏好度,并计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户,根据每个所述相似核心用户对不同主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐主播。不需要目标用户的任何直播平台观影数据就能实现对目标用户的个性化主播推荐,解决了用户冷启动问题。
Description
技术领域
本发明涉及互联网技术领域,更具体的,涉及一种基于用户相似度的主播推荐方法及装置。
背景技术
随着直播的兴起,出现了很多大型真人互动视频直播社区,简称直播平台。直播平台中存在大量不同类型的主播,而不同用户喜欢的主播类型不同。为了提高用户对主播观看的时长和用户的留存度,很多直播平台都会对用户进行个性化的主播推荐。
老用户的个性化推荐问题可以通过用户在直播平台内的行为来进行针对性推荐,但是对于没有使用过直播平台的用户,即冷启动用户来说,无法根据直播平台历史数据为其针对性的推荐主播,存在新用户的冷启动问题。
发明内容
有鉴于此,本发明提供了一种基于用户相似度的主播推荐方法及装置,解决了用户冷启动问题,为新用户提供个性化的主播推荐。
为了实现上述发明目的,本发明提供的具体技术方案如下:
一种基于用户相似度的主播推荐方法,包括:
计算直播平台中每个核心用户对每个主播的偏好度;
计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户;
根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播。
优选的,在所述计算直播平台中每个核心用户对每个主播的偏好度之前,所述方法还包括:
根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户。
优选的,所述根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户,包括:
获取预设时间段内直播平台中每个用户对每个主播的观影时长数据,过滤掉不符合预设观影时长要求的用户,得到符合预设观影时长要求的直播平台用户;
获取所述预设时间段内直播平台中每个用户对每个主播的消费金额,过滤掉所述预设时间段内消费金额为0的用户,得到符合预设消费金额要求的直播平台用户;
将符合预设观影时长要求的直播平台用户和/或符合预设消费金额要求的直播平台用户确定为直播平台中的核心用户。
优选的,所述计算直播平台中每个核心用户对每个主播的偏好度,包括:
根据预设时间段内每个所述核心用户对每个主播的观影时长,计算每个所述核心用户对每个主播的观影分数;
根据所述预设时间段内每个所述核心用户对每个主播的消费金额,计算每个所述核心用户对每个主播的消费分数;
根据预设的观影分数的权重和消费分数的权重,分别对每个所述核心用户的观影分数和消费分数进行加权求和计算,得到每个所述核心用户对每个主播的偏好度。
优选的,所述计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户,包括:
针对每个预设维度提取每个所述核心用户、以及所述目标用户的特征值;
分别对每个所述核心用户、以及所述目标用户的特征值进行编码,得到每个所述核心用户、以及所述目标用户的多维特征向量;
根据预设哈希函数族中的每个哈希函数计算每个所述核心用户、以及所述目标用户的多维特征向量对应的每个哈希函数的哈希值,并根据所述哈希函数族中每个哈希函数间的级联规则,得到每个所述核心用户、以及所述目标用户的哈希值级联结果;
将与所述目标用户的哈希值级联结果相同的核心用户确定为所述目标用户相似的用户集合;
分别计算所述用户集合中的每个核心用户与所述目标用户的相似度;
对所述用户集合中的每个核心用户与所述目标用户的相似度进行排序,所述用户集合中的每个核心用户对应一个排序名次;
将满足第一预设排序名次的多个核心用户确定为所述目标用户的相似核心用户。
优选的,所述根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播,包括:
根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,计算所述目标用户对每个主播的偏好度;
根据所述目标用户对每个主播的偏好度为所述目标用户推荐对应的主播。
一种基于用户相似度的主播推荐装置,包括:
偏好度计算单元,用于计算直播平台中每个核心用户对每个主播的偏好度;
相似度计算单元,用于计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户;
主播推荐单元,用于根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播。
优选的,所述装置还包括:
核心用户确定单元,用于根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户。
优选的,所述核心用户确定单元,包括:
第一获取单元,用于获取预设时间段内直播平台中每个用户对每个主播的观影时长数据,过滤掉不符合预设观影时长要求的用户,得到符合预设观影时长要求的直播平台用户;
第二获取单元,用于获取所述预设时间段内直播平台中每个用户对每个主播的消费金额,过滤掉所述预设时间段内消费金额为0的用户,得到符合预设消费金额要求的直播平台用户;
第一确定子单元,用于将符合预设观影时长要求的直播平台用户和/或符合预设消费金额要求的直播平台用户确定为直播平台中的核心用户。
优选的,所述偏好度计算单元包括:
第一计算子单元,用于根据预设时间段内每个所述核心用户对每个主播的观影时长,计算每个所述核心用户对每个主播的观影分数;
第二计算子单元,用于根据所述预设时间段内每个所述核心用户对每个主播的消费金额,计算每个所述核心用户对每个主播的消费分数;
第三计算子单元,用于根据预设的观影分数的权重和消费分数的权重,分别对每个所述核心用户的观影分数和消费分数进行加权求和计算,得到每个所述核心用户对每个主播的偏好度。
优选的,所述相似度计算单元包括:
提取子单元,用于针对每个预设维度提取每个所述核心用户、以及所述目标用户的特征值;
编码子单元,用于分别对每个所述核心用户、以及所述目标用户的特征值进行编码,得到每个所述核心用户、以及所述目标用户的多维特征向量;
第四计算子单元,用于根据预设哈希函数族中的每个哈希函数计算每个所述核心用户、以及所述目标用户的多维特征向量对应的每个哈希函数的哈希值,并根据所述哈希函数族中每个哈希函数间的级联规则,得到每个所述核心用户、以及所述目标用户的哈希值级联结果;
第二确定子单元,用于将与所述目标用户的哈希值级联结果相同的核心用户确定为所述目标用户相似的用户集合;
第五计算子单元,用于分别计算所述用户集合中的每个核心用户与所述目标用户的相似度;
第一排序子单元,用于对所述用户集合中的每个核心用户与所述目标用户的相似度进行排序,所述用户集合中的每个核心用户对应一个排序名次;
第三确定子单元,用于将满足第一预设排序名次的多个核心用户确定为所述目标用户的相似核心用户。
优选的,所述主播推荐单元包括:
第六计算子单元,用于根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,计算所述目标用户对每个主播的偏好度;
推荐子单元,用于根据所述目标用户对每个主播的偏好度为所述目标用户推荐对应的主播。
相对于现有技术,本发明提供的有益效果如下:
本发明公开的一种基于用户相似度的主播推荐方法及装置,通过计算直播平台中每个核心用户对每个主播的偏好度,并计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户,根据每个所述相似核心用户对不同主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐主播。不需要目标用户的任何直播平台观影数据就能实现对目标用户的个性化主播推荐,解决了用户冷启动问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种基于用户相似度的主播推荐方法流程图;
图2为本发明实施例公开的一种用户对每个主播的偏好度计算方法流程图;
图3为本发明实施例公开的另一种基于用户相似度的主播推荐方法流程图;
图4为本发明实施例公开的一种用户相似度的计算方法流程图;
图5为本发明实施例公开的一种基于用户相似度的主播推荐装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本实施例公开了一种基于用户相似度的主播推荐方法,具体包括以下步骤:
S101:计算直播平台中每个核心用户对每个主播的偏好度;
直播平台中的核心用户是在直播平台中具有一定观影时长或消费金额的用户,即,直播平台中的核心用户具有对不同主播的观影历史数据和/或消费历史数据。
具体的,可以根据直播平台中的核心用户具有对不同主播的观影历史数据和/或消费历史数据计算每个核心用户对不同主播的偏好度。偏好度表示核心用户对不同主播的偏好程度,可以理解的是,不同核心用户对同一主播的偏好度可能不同,同一核心用户对不同主播的偏好度也可能不同。
优选的,请参阅图2,S102的具体实施方法如下:
S201:根据预设时间段内每个所述核心用户对每个主播的观影时长,计算每个所述核心用户对每个主播的观影分数;
预设时间段为预先设定的一段时间,如,一个月、两个月等。
具体的,观影分数的计算公式为:
其中,time_scoreij为核心用户i对主播j的观影分数,tij为预设时间段内核心用户i对主播j的观影时长,单位为秒。
S202:根据所述预设时间段内每个所述核心用户对每个主播的消费金额,计算每个所述核心用户对每个主播的消费分数;
具体的,消费分数的计算公式为:
其中,consume_scoreij为直播平台核心用户i对主播j的消费分数,cij为预设时间段内直播平台核心用户i对主播j的消费金额,单位为分。
S203:根据预设的观影分数的权重和消费分数的权重,分别对每个所述核心用户的观影分数和消费分数进行加权求和计算,得到每个所述核心用户对每个主播的偏好度。
观影分数的权重和消费分数的权重是预先设定的,表示观影分数和消费分数在核心用户对不同主播偏好度计算中的重要程度,例如:观影分数的权重为0.4,消费分数的权重为0.6,可以理解的是,以上仅为一种可选的权重设置方案,本发明并不以此为限。
基于上述权重设置方案,偏好度计算公式为:
final_score=0.4*time_scoreij+0.6*consume_scoreij
S102:计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户;
目标用户为需要对其进行个性化主播推荐的用户。所述目标用户可以为没有任何直播平台历史数据的新用户,可以为具有一定直播平台历史数据,如观影数据、消费数据等的用户。
对于同一直播平台中的用户都具有多个维度的特征,如,年龄、性别、地区等等,不同用户在某个维度的特征可能相同,不同用户相似的维度特征可能不同,因此,不同用户之间的相似度也不同。
通过计算每个所述核心用户与目标用户之间的相似度可以了解每个所述核心用户与目标用户之间的相似程度,选取与目标用户相似度比较高的多个核心用户作为所述目标用户的多个相似核心用户。
S103:根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播。
物以类聚,人以群分,相似的用户很可能对同一主播具有相似的偏好度,基于这一规律,根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,估算目标用户对每个主播的偏好度,并将偏好度较高的多个主播推荐给目标用户。
具体的,根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,计算所述目标用户对每个主播的偏好度;
根据所述目标用户对每个主播的偏好度为所述目标用户推荐对应的主播。
具体的,可以对所述目标用户对每个主播的偏好度进行排序,每个主播对应一个排序名次,将满足第二预设排序名次的多个主播推荐给目标用户;也可以为将偏好度大于阈值的主播推荐给目标用户
目标用户对每个主播的偏好度的计算公式为:
其中,wij表示目标用户i对主播j的偏好度,uik表示目标用户i与相似核心用户k之间的相似度,akj表示相似核心用户k对主播j的偏好度,K为相似核心用户的数量。
可以理解的是,目标用户对不同主播的偏好度不同,将目标用户对不同主播的偏好度进行排序,每个主播对应一个排序名次,将满足第二预设排序名次的多个主播推荐给所述目标用户。第二排序名次可以为前50名,前30名等等。
最后,将满足第二预设排序名次的多个主播以标签的形式存储在数据库中,并通过包装http接口提供给直播平台中的目标用户,当然,也可以为其他推荐方式,本发明并不以此为限。
本实施例公开的一种基于用户相似度的主播推荐方法,通过计算直播平台中每个核心用户对每个主播的偏好度,并计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户,根据每个所述相似核心用户对不同主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐主播。不需要目标用户的任何直播平台观影数据就能实现对目标用户的个性化主播推荐,解决了用户冷启动问题。
请参阅图3,本实施例公开了另一种基于用户相似度的主播推荐方法,具体包括以下步骤:
S301:根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户;
直播平台中的每个用户为使用该直播平台观看直播的用户。
具体的,S301一种优选的实施方式如下:
获取预设时间段内直播平台中每个用户对每个主播的观影时长数据,过滤掉不符合预设观影时长要求的用户,得到符合预设观影时长要求的直播平台用户;
观影时长数据可以为用户对每个主笔的平均每日观影时长,相应的,不符合预设观影时长要求的用户为对于每个主播平均每日观影时长都小于第一预设值的用户。
获取所述预设时间段内直播平台中每个用户对每个主播的消费金额,过滤掉所述预设时间段内消费金额为0的用户,得到符合预设消费金额要求的直播平台用户;
可以理解的是,符合预设消费金额要求的用户就是过滤掉在预设时间段内消费金额为0的用户后的用户。
将符合预设观影时长要求的直播平台用户和/或符合预设消费金额要求的直播平台用户确定为直播平台中的核心用户。
S302:计算直播平台中每个核心用户对每个主播的偏好度;
S303:计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户;
S304:根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播。
本实施例公开的一种基于用户相似度的主播推荐方法,在计算直播平台中每个核心用户对不同主播的偏好度之前对直播平台用户进行预处理,根据直播平台中每个用户对不同主播的观影时间和直播平台中每个用户对不同主播的消费金额,确定多个直播平台核心用户,过滤掉观影时长过短或未在直播平台中进行消费的用户,使得到的直播平台核心用户更具参考价值,进而使最后推荐为目标用户的主播更符合目标用户的个性化需求。
基于上述实施例公开的一种基于用户相似度的主播推荐方法,请参阅图4,本实施例公开了计算核心用户与目标用户之间相似度的方法,具体包括以下步骤:
S401:针对每个预设维度提取每个所述核心用户、以及所述目标用户的特征值;
根据多个预设维度的特征值表示每个核心用户、以及目标用户,以爱奇艺视频播放平台为例,包括观影、阅读、GPS、手机安装程序、泡泡等十一大业务线,每个业务线又包括多个维度,如观影包括:电影、电视剧、综艺等等类型,电影又包括爱情、动作、悬疑、喜剧等维度。
特征值可以为是或否数值化后为0或1,也可以为具体数值,例如爱情类电影观看数量等等。
S402:分别对每个所述核心用户、以及所述目标用户的特征值进行编码,得到每个所述核心用户、以及所述目标用户的多维特征向量;
具体通过N位状态寄存器分别对每个所述核心用户、以及所述目标用户N个预设维度的特征值进行编码,每个预设维度都有独立的寄存器位,构建近三百万维的稀疏矩阵,即多维特征向量。
S403:根据预设哈希函数族中的每个哈希函数计算每个所述核心用户、以及所述目标用户的多维特征向量对应的每个哈希函数的哈希值,并根据所述哈希函数族中每个哈希函数间的级联规则,得到每个所述核心用户、以及所述目标用户的哈希值级联结果;
预设哈希函数族是多个哈希函数的集合。
S404:将与所述目标用户的哈希值级联结果相同的核心用户确定为所述目标用户相似的用户集合;
S405:分别计算所述用户集合中的每个核心用户与所述目标用户的相似度;
S406:对所述用户集合中的每个核心用户与所述目标用户的相似度进行排序,所述用户集合中的每个核心用户对应一个排序名次;
S407:将满足第一预设排序名次的多个核心用户确定为所述目标用户的相似核心用户。
由于核心用户是海量的,且在实际中也有海量目标用户,如果直接对用户两两之间计算相似度的计算量是巨大的,会造成服务器的巨大负担,且耗时太长。因此,本实施例利用局部敏感哈希的方法来进行快速的相似用户查找。
局部敏感哈希算法,又称为LSH算法。它的基础是基于一个假设,如果两个向量在原有的空间是相似的,那么分别经过哈希函数转换之后,它们依然能具有很高的相似度,反之亦然。所以如果我们找到这样的哈希函数对高维的向量进行处理,就可以快速地将向量进行分组,从而让相似的向量被归为一组。这样我们就可以只对相同组内部的向量进行相似度计算了,从而大大减少了计算复杂度。
对于不同的距离度量方法,有不同的哈希函数族来进行局部敏感哈希。对于选用的Jaccard相似度而言,min-hashing(最小哈希)就是适合的哈希函数族。最小哈希的函数族如以下公式所述。它返回根据每个哈希函数对每个核心用户、以及目标用户计算得到的哈希值中第一个值为1的行的行号c。
hπ(c)=minπ(c)
使用最小哈希方法后,对于两个向量,它们哈希值相同的概率等于它们降维前的Jaccard相似度。
所以,我们从同一个哈希函数族中选出多个哈希函数,根据哈希函数族中的每个哈希函数计算每个所述核心用户、以及所述目标用户的多维特征向量对应的每个哈希函数的哈希值,并根据所述哈希函数族中每个哈希函数间的级联规则,即每两个哈希函数间是and关系还是or关系,例如哈希函数1and哈希函数2and哈希函数3and哈希函数3and哈希函数4and哈希函数5等等,得到每个所述核心用户、以及所述目标用户的哈希值级联结果。将与所述目标用户的哈希值级联结果相同的核心用户确定为所述目标用户相似的用户集合。
在计算每个核心用户与所述目标用户的相似度的时候,只计算和目标用户在一个用户集合中的核心用户的相似度。
计算所述用户集合中的每个核心用户与所述目标用户的相似度的方式为:
其中,A和B分别为目标用户的多维特征向量和所述用户集合中的某个核心用户的多维特征向量。
可以理解的是,目标用户与所述用户集合中的每个核心用户之间的相似度不同,对所述用户集合中的每个核心用户与所述目标用户的相似度进行排序,所述用户集合中的每个核心用户对应一个排序名次;将满足第一预设排序名次的多个核心用户确定为所述目标用户的相似核心用户。第一预设排序名次可以为前10名、前15名等等。
本实施例提供的计算核心用户与目标用户之间相似度的方法,降低了计算核心用户与目标用户之间相似度的计算量,提高了计算效率和计算速度。
基于上述实施例公开的一种基于用户相似度的主播推荐方法,请参阅图5,本实施例对应公开了一种基于用户相似度的主播推荐装置,包括:
偏好度计算单元501,用于计算直播平台中每个核心用户对每个主播的偏好度;
相似度计算单元502,用于计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户;
主播推荐单元503,用于根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播。
优选的,所述装置还包括:
核心用户确定单元,用于根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户。
优选的,所述核心用户确定单元,包括:
第一获取单元,用于获取预设时间段内直播平台中每个用户对每个主播的观影时长数据,过滤掉不符合预设观影时长要求的用户,得到符合预设观影时长要求的直播平台用户;
第二获取单元,用于获取所述预设时间段内直播平台中每个用户对每个主播的消费金额,过滤掉所述预设时间段内消费金额为0的用户,得到符合预设消费金额要求的直播平台用户;
第一确定子单元,用于将符合预设观影时长要求的直播平台用户和/或符合预设消费金额要求的直播平台用户确定为直播平台中的核心用户。
优选的,所述偏好度计算单元501包括:
第一计算子单元,用于根据预设时间段内每个所述核心用户对每个主播的观影时长,计算每个所述核心用户对每个主播的观影分数;
第二计算子单元,用于根据所述预设时间段内每个所述核心用户对每个主播的消费金额,计算每个所述核心用户对每个主播的消费分数;
第三计算子单元,用于根据预设的观影分数的权重和消费分数的权重,分别对每个所述核心用户的观影分数和消费分数进行加权求和计算,得到每个所述核心用户对每个主播的偏好度。
优选的,所述相似度计算单元502包括:
提取子单元,用于针对每个预设维度提取每个所述核心用户、以及所述目标用户的特征值;
编码子单元,用于分别对每个所述直播平台核心用户、以及所述目标用户的特征值进行编码,得到每个所述核心用户、以及所述目标用户的多维特征向量;
第四计算子单元,用于根据预设哈希函数族中的每个哈希函数计算每个所述核心用户、以及所述目标用户的多维特征向量对应的每个哈希函数的哈希值,并根据所述哈希函数族中每个哈希函数间的级联规则,得到每个所述核心用户、以及所述目标用户的哈希值级联结果;
第二确定子单元,用于将与所述目标用户的哈希值级联结果相同的核心用户确定为所述目标用户相似的用户集合;
第五计算子单元,用于分别计算所述用户集合中的每个核心用户与所述目标用户的相似度;
第一排序子单元,用于对所述用户集合中的每个核心用户与所述目标用户的相似度进行排序,所述用户集合中的每个核心用户对应一个排序名次;
第三确定子单元,用于将满足第一预设排序名次的多个核心用户确定为所述目标用户的相似核心用户。
优选的,所述主播推荐单元503包括:
第六计算子单元,用于根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,计算所述目标用户对每个主播的偏好度;
推荐子单元,用于根据所述目标用户对每个主播的偏好度为所述目标用户推荐对应的主播。
本实施例公开的一种基于用户相似度的主播推荐装置,通过计算直播平台中每个核心用户对每个主播的偏好度,并计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户,根据每个所述相似核心用户对不同主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐主播。不需要目标用户的任何直播平台观影数据就能实现对目标用户的个性化主播推荐,解决了用户冷启动问题。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (12)
1.一种基于用户相似度的主播推荐方法,其特征在于,包括:
计算直播平台中每个核心用户对每个主播的偏好度;
计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户;
根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播。
2.根据权利要求1所述的方法,其特征在于,在所述计算直播平台中每个核心用户对每个主播的偏好度之前,所述方法还包括:
根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户。
3.根据权利要求2所述的方法,其特征在于,所述根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户,包括:
获取预设时间段内直播平台中每个用户对每个主播的观影时长数据,过滤掉不符合预设观影时长要求的用户,得到符合预设观影时长要求的直播平台用户;
获取所述预设时间段内直播平台中每个用户对每个主播的消费金额,过滤掉所述预设时间段内消费金额为0的用户,得到符合预设消费金额要求的直播平台用户;
将符合预设观影时长要求的直播平台用户和/或符合预设消费金额要求的直播平台用户确定为直播平台中的核心用户。
4.根据权利要求1所述的方法,其特征在于,所述计算直播平台中每个核心用户对每个主播的偏好度,包括:
根据预设时间段内每个所述核心用户对每个主播的观影时长,计算每个所述核心用户对每个主播的观影分数;
根据所述预设时间段内每个所述核心用户对每个主播的消费金额,计算每个所述核心用户对每个主播的消费分数;
根据预设的观影分数的权重和消费分数的权重,分别对每个所述核心用户的观影分数和消费分数进行加权求和计算,得到每个所述核心用户对每个主播的偏好度。
5.根据权利要求1所述的方法,其特征在于,所述计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户,包括:
针对每个预设维度提取每个所述核心用户、以及所述目标用户的特征值;
分别对每个所述核心用户、以及所述目标用户的特征值进行编码,得到每个所述核心用户、以及所述目标用户的多维特征向量;
根据预设哈希函数族中的每个哈希函数计算每个所述核心用户、以及所述目标用户的多维特征向量对应的每个哈希函数的哈希值,并根据所述哈希函数族中每个哈希函数间的级联规则,得到每个所述核心用户、以及所述目标用户的哈希值级联结果;
将与所述目标用户的哈希值级联结果相同的核心用户确定为所述目标用户相似的用户集合;
分别计算所述用户集合中的每个核心用户与所述目标用户的相似度;
对所述用户集合中的每个核心用户与所述目标用户的相似度进行排序,所述用户集合中的每个核心用户对应一个排序名次;
将满足第一预设排序名次的多个核心用户确定为所述目标用户的相似核心用户。
6.根据权利要求1所述的方法,其特征在于,所述根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播,包括:
根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,计算所述目标用户对每个主播的偏好度;
根据所述目标用户对不同主播的偏好度为所述目标用户推荐对应的主播。
7.一种基于用户相似度的主播推荐装置,其特征在于,包括:
偏好度计算单元,用于计算直播平台中每个核心用户对每个主播的偏好度;
相似度计算单元,用于计算每个所述核心用户与目标用户之间的相似度,并根据每个所述核心用户与目标用户之间的相似度得到所述目标用户的多个相似核心用户;
主播推荐单元,用于根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,为所述目标用户推荐对应的主播。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
核心用户确定单元,用于根据直播平台中每个用户对每个主播的观影时间和直播平台中每个用户对每个主播的消费金额,确定所述每个核心用户。
9.根据权利要求8所述的装置,其特征在于,所述核心用户确定单元,包括:
第一获取单元,用于获取预设时间段内直播平台中每个用户对每个主播的观影时长数据,过滤掉不符合预设观影时长要求的用户,得到符合预设观影时长要求的直播平台用户;
第二获取单元,用于获取所述预设时间段内直播平台中每个用户对每个主播的消费金额,过滤掉所述预设时间段内消费金额为0的用户,得到符合预设消费金额要求的直播平台用户;
第一确定子单元,用于将符合预设观影时长要求的直播平台用户和/或符合预设消费金额要求的直播平台用户确定为直播平台中的核心用户。
10.根据权利要求7所述的装置,其特征在于,所述偏好度计算单元包括:
第一计算子单元,用于根据预设时间段内每个所述核心用户对每个主播的观影时长,计算每个所述核心用户对每个主播的观影分数;
第二计算子单元,用于根据所述预设时间段内每个所述核心用户对每个主播的消费金额,计算每个所述核心用户对每个主播的消费分数;
第三计算子单元,用于根据预设的观影分数的权重和消费分数的权重,分别对每个所述核心用户的观影分数和消费分数进行加权求和计算,得到每个所述核心用户对每个主播的偏好度。
11.根据权利要求7所述的装置,其特征在于,所述相似度计算单元包括:
提取子单元,用于针对每个预设维度提取每个所述核心用户、以及所述目标用户的特征值;
编码子单元,用于分别对每个所述核心用户、以及所述目标用户的特征值进行编码,得到每个所述核心用户、以及所述目标用户的多维特征向量;
第四计算子单元,用于根据预设哈希函数族中的每个哈希函数计算每个所述核心用户、以及所述目标用户的多维特征向量对应的每个哈希函数的哈希值,并根据所述哈希函数族中每个哈希函数间的级联规则,得到每个所述核心用户、以及所述目标用户的哈希值级联结果;
第二确定子单元,用于将与所述目标用户的哈希值级联结果相同的核心用户确定为所述目标用户相似的用户集合;
第五计算子单元,用于分别计算所述用户集合中的每个核心用户与所述目标用户的相似度;
第一排序子单元,用于对所述用户集合中的每个直播平台核心用户与所述目标用户的相似度进行排序,所述用户集合中的每个核心用户对应一个排序名次;
第三确定子单元,用于将满足第一预设排序名次的多个核心用户确定为所述目标用户的相似核心用户。
12.根据权利要求7所述的装置,其特征在于,所述主播推荐单元包括:
第六计算子单元,用于根据每个所述相似核心用户对每个主播的偏好度、以及每个所述相似核心用户与所述目标用户之间的相似度,计算所述目标用户对每个主播的偏好度;
推荐子单元,用于根据所述目标用户对每个主播的偏好度为所述目标用户推荐对应的主播。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810478899.6A CN108664654A (zh) | 2018-05-18 | 2018-05-18 | 一种基于用户相似度的主播推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810478899.6A CN108664654A (zh) | 2018-05-18 | 2018-05-18 | 一种基于用户相似度的主播推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108664654A true CN108664654A (zh) | 2018-10-16 |
Family
ID=63776877
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810478899.6A Pending CN108664654A (zh) | 2018-05-18 | 2018-05-18 | 一种基于用户相似度的主播推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108664654A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109462778A (zh) * | 2018-11-15 | 2019-03-12 | 武汉斗鱼网络科技有限公司 | 一种直播标识的推荐方法以及相关设备 |
CN109862013A (zh) * | 2019-01-31 | 2019-06-07 | 武汉斗鱼网络科技有限公司 | 一种直播间推荐方法、存储介质、电子设备及系统 |
CN110928521A (zh) * | 2020-02-17 | 2020-03-27 | 恒信东方文化股份有限公司 | 一种智能语音交流方法及其交流系统 |
CN111432226A (zh) * | 2020-03-27 | 2020-07-17 | 广州酷狗计算机科技有限公司 | 直播推荐方法、装置、服务器、终端及存储介质 |
CN111626817A (zh) * | 2020-05-10 | 2020-09-04 | 石伟 | 基于电子商务大数据的用户画像解析方法及人工智能平台 |
CN111737519A (zh) * | 2020-06-09 | 2020-10-02 | 北京奇艺世纪科技有限公司 | 识别机器人账号的方法、装置、电子设备及计算机可读存储介质 |
WO2021114938A1 (zh) * | 2019-12-11 | 2021-06-17 | 掌阅科技股份有限公司 | 页面跳转方法、计算设备及计算机存储介质 |
CN113301442A (zh) * | 2021-05-20 | 2021-08-24 | 北京百度网讯科技有限公司 | 确定直播资源的方法、设备、介质及程序产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447015A (zh) * | 2014-08-18 | 2016-03-30 | 上海众聘信息科技有限公司 | 基于移动终端的职位信息推送方法、装置及系统 |
CN105812411A (zh) * | 2014-12-30 | 2016-07-27 | 大唐软件技术股份有限公司 | 定制信息的推荐方法和装置 |
CN107172452A (zh) * | 2017-04-25 | 2017-09-15 | 北京潘达互娱科技有限公司 | 直播间推荐方法及装置 |
-
2018
- 2018-05-18 CN CN201810478899.6A patent/CN108664654A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105447015A (zh) * | 2014-08-18 | 2016-03-30 | 上海众聘信息科技有限公司 | 基于移动终端的职位信息推送方法、装置及系统 |
CN105812411A (zh) * | 2014-12-30 | 2016-07-27 | 大唐软件技术股份有限公司 | 定制信息的推荐方法和装置 |
CN107172452A (zh) * | 2017-04-25 | 2017-09-15 | 北京潘达互娱科技有限公司 | 直播间推荐方法及装置 |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109462778B (zh) * | 2018-11-15 | 2020-10-16 | 武汉斗鱼网络科技有限公司 | 一种直播标识的推荐方法以及相关设备 |
CN109462778A (zh) * | 2018-11-15 | 2019-03-12 | 武汉斗鱼网络科技有限公司 | 一种直播标识的推荐方法以及相关设备 |
CN109862013A (zh) * | 2019-01-31 | 2019-06-07 | 武汉斗鱼网络科技有限公司 | 一种直播间推荐方法、存储介质、电子设备及系统 |
CN109862013B (zh) * | 2019-01-31 | 2021-06-15 | 武汉斗鱼网络科技有限公司 | 一种直播间推荐方法、存储介质、电子设备及系统 |
WO2021114938A1 (zh) * | 2019-12-11 | 2021-06-17 | 掌阅科技股份有限公司 | 页面跳转方法、计算设备及计算机存储介质 |
CN110928521A (zh) * | 2020-02-17 | 2020-03-27 | 恒信东方文化股份有限公司 | 一种智能语音交流方法及其交流系统 |
CN111432226A (zh) * | 2020-03-27 | 2020-07-17 | 广州酷狗计算机科技有限公司 | 直播推荐方法、装置、服务器、终端及存储介质 |
CN111626817A (zh) * | 2020-05-10 | 2020-09-04 | 石伟 | 基于电子商务大数据的用户画像解析方法及人工智能平台 |
CN111626817B (zh) * | 2020-05-10 | 2020-12-22 | 长沙居美网络科技有限公司 | 基于电子商务大数据的用户画像解析方法及人工智能平台 |
CN111737519A (zh) * | 2020-06-09 | 2020-10-02 | 北京奇艺世纪科技有限公司 | 识别机器人账号的方法、装置、电子设备及计算机可读存储介质 |
CN111737519B (zh) * | 2020-06-09 | 2023-10-03 | 北京奇艺世纪科技有限公司 | 识别机器人账号的方法、装置、电子设备及计算机可读存储介质 |
CN113301442A (zh) * | 2021-05-20 | 2021-08-24 | 北京百度网讯科技有限公司 | 确定直播资源的方法、设备、介质及程序产品 |
CN113301442B (zh) * | 2021-05-20 | 2022-10-21 | 北京百度网讯科技有限公司 | 确定直播资源的方法、设备、介质及程序产品 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108664654A (zh) | 一种基于用户相似度的主播推荐方法及装置 | |
CN105677715B (zh) | 一种基于多用户的视频推荐方法及装置 | |
CN107222566B (zh) | 信息推送方法、装置及服务器 | |
KR101060487B1 (ko) | 태그 클라우드를 이용한 콘텐츠 추천 장치 및 방법 | |
US8204878B2 (en) | System and method for finding unexpected, but relevant content in an information retrieval system | |
CN112052387B (zh) | 一种内容推荐方法、装置和计算机可读存储介质 | |
CN105430505B (zh) | 一种基于组合策略的iptv节目推荐方法 | |
US20120185481A1 (en) | Method and Apparatus for Executing a Recommendation | |
CN105069122B (zh) | 一种基于用户行为的个性化推荐方法及其推荐装置 | |
CN105975641A (zh) | 视频推荐方法及装置 | |
CN106294830A (zh) | 多媒体资源的推荐方法及装置 | |
CN104834686A (zh) | 一种基于混合语义矩阵的视频推荐方法 | |
CN109636481A (zh) | 面向家庭用户的用户画像构建方法及装置 | |
CN105005582A (zh) | 多媒体信息的推荐方法及装置 | |
CN105022729B (zh) | 一种用户偏好确定方法及装置 | |
CN106168980A (zh) | 多媒体资源推荐排序方法及装置 | |
CN103106208A (zh) | 一种移动互联网中的流媒体内容推荐方法和系统 | |
CN109241451B (zh) | 一种内容组合推荐方法、装置及可读存储介质 | |
KR101151176B1 (ko) | 메뉴 선호 정보를 이용한 콘텐츠 추천 방법 | |
CN104239552B (zh) | 生成关联关键词、提供关联关键词的方法及系统 | |
CN109753601A (zh) | 推荐信息点击率确定方法、装置及电子设备 | |
CN110737859A (zh) | 一种up主匹配方法及装置 | |
CN103927673A (zh) | 一种推荐业务信息的方法及装置 | |
CN106326388A (zh) | 一种信息处理方法和装置 | |
CN111523035A (zh) | App浏览内容的推荐方法、装置、服务器和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181016 |
|
RJ01 | Rejection of invention patent application after publication |