CN106560811A - 一种基于主播风格的直播间推荐方法及系统 - Google Patents

一种基于主播风格的直播间推荐方法及系统 Download PDF

Info

Publication number
CN106560811A
CN106560811A CN201610846016.3A CN201610846016A CN106560811A CN 106560811 A CN106560811 A CN 106560811A CN 201610846016 A CN201610846016 A CN 201610846016A CN 106560811 A CN106560811 A CN 106560811A
Authority
CN
China
Prior art keywords
direct broadcasting
broadcasting room
room
user
characteristic vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610846016.3A
Other languages
English (en)
Inventor
龚灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201610846016.3A priority Critical patent/CN106560811A/zh
Publication of CN106560811A publication Critical patent/CN106560811A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences

Abstract

本发明公开了一种基于主播风格的直播间推荐方法及系统,涉及网络技术领域。该方法包括以下步骤:从服务器收集设定时间段内直播间的特征参数和用户数据;将每一个直播间的特征参数作为特征值,构建该直播间的特征向量;选取主播个人信息不相同的任意两个直播间,计算两个直播间的特征向量之间的相似度,并判定相似的直播间;根据每一个直播间的用户数据,将与该直播间相似的其它直播间推荐给该直播间的所有用户;根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,使用评价指标对特征向量的特征值进行筛选,并使用筛选后的特征向量判定相似的直播间。本发明能够向用户精准推荐主播风格相似的直播间,提高推荐效率,提升用户体验。

Description

一种基于主播风格的直播间推荐方法及系统
本发明涉及网络技术领域,具体是涉及一种基于主播风格的直播间推荐方法及系统。
背景技术
随着网络技术和移动智能终端的发展,网络视频直播由于综合了图像、声音和文字的优点,特别是向用户提供即时与互动的交流和沟通方式而受到用户的青睐,中国社交视频直播社区的活跃用户数量不断增加,根据艾瑞网2014年12月发布的报告显示,近几年中国社交视频行业用户规模将以30%左右的增速发展,并预测到2017年,中国社交视频将涵盖超过4亿人。面对如此巨大的市场需求,如何向用户精准推荐直播间来提高用户粘性并促进用户的付费转化,成为直播行业迫切需要解决的问题。目前常用的向用户推荐直播间的方法是热播榜推荐,也就是向用户推荐一段时间内直播网站里按照受欢迎程度排序的主播的榜单。这种方法的缺点是没有考虑到用户的个性化需求,其对新用户具有一定的效果,但是老用户通常按照自己的偏好挑选直播间,因此这种方法对于老用户的推荐效果较差。
发明内容
针对现有技术中存在的缺陷,本发明的主要目的在于提供一种基于主播风格的直播间推荐方法,本发明的另一目的在于提供一种基于主播风格的直播间推荐系统,被推荐的直播间充分反映出各直播间的主播的不同风格,向用户精准推荐主播风格相似的直播间。
本发明提供一种基于主播风格的直播间推荐方法,包括步骤:
S1.从服务器收集设定时间段内直播间的特征参数和用户数据,所述特征参数包括直播间的主播个人信息、房间信息和开播信息;
S2.将每一个直播间的所述特征参数作为特征值,构建该直播间的特征向量;
S3.选取所述主播个人信息不相同的任意两个直播间,计算两个所述直播间的特征向量之间的相似度,依据得到的相似度的数值大小,判定相似的直播间;
S4.根据每一个直播间的所述用户数据,将与该直播间相似的其它直播间推荐给该直播间的所有用户;
S5.根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,使用评价指标对特征向量的特征值进行筛选,并使用筛选后的特征向量判定相似的直播间。
在上述技术方案的基础上,所述主播个人信息包括主播名称、主播昵称、主播性别和主播年龄,所述房间信息包括房间所在分区、房间标题和房间主题,所述开播信息包括开播次数、开播时段、每次开播时长和总开播时长。
在上述技术方案的基础上,步骤S3中,所述相似度的计算依据公式:其中,X和Y分别为两个直播间的特征向量,X=(aX1,…,aXi,…,aXn),Y=(aY1,…,aYi,…,aYn),i=1,2,…,n,n为特征向量X和Y中特征值的总数,n为正整数,aXi和aYi分别表示特征向量X和Y的第i个特征值,Sim(X,Y)为特征向量X和Y的余弦相似度,X·Y为特征向量X和Y的内积,||X||和||Y||分别为特征向量X和Y的模。
在上述技术方案的基础上,步骤S3中,判定相似的直播间的方法为:
对得到的所有相似度按照数值大小降序排列,获得相似度队列;
从所述相似度对列中按照至由大至小的顺序选取预设数量的相似度的数值,将选取的每一个相似度的数值对应的两个直播间判定为相似的直播间。
在上述技术方案的基础上,步骤S5中,所述评价指标包括用户的平均访问率A和平均回访率B;
被推荐的直播间的访问率和/或回访率根据用户访问的被推荐的直播间的数量、被推荐的直播间总数、用户本次访问的上次被推荐的直播间的数量和用户本次访问的直播间总数计算得到;
所述平均访问率A的计算依据公式:
所述平均回访率B的计算依据公式:
其中,对于由访问被推荐的直播间的用户组成的任一个用户集合,m为所述用户集合中的用户总数,Aj和Bj分别为所述用户集合中第j个用户访问被推荐的直播间的访问率和回访率,j=1,2,…,m,所述被推荐的直播间为根据所述直播间的特征向量之间的相似度的数值大小判定为相似的直播间。
在上述技术方案的基础上,步骤S5具体包括:
S5.1将访问过被推荐的直播间的用户划分为用户数量相同的若干训练集,所述训练集的数量大于所述特征向量中特征值的总数n,n为正整数;
S5.2从当前使用的特征向量中删除任一个特征值,得到待筛选特征向量,对于任一个所述训练集,将当前使用的特征向量或任一个待筛选特征向量作为所述直播间的特征向量,计算相应的评价指标;
S5.3若任一个所述待筛选特征向量的评价指标的数值不小于当前使用的特征向量的评价指标的数值,则进入步骤S5.4;否则,进入步骤S5.5;
S5.4将数值最大的评价指标对应的所述待筛选特征向量替换为当前使用的特征向量,剔除使用过的所述训练集,进入步骤S5.2;
S5.5将所述当前使用的特征向量作为筛选后的特征向量判定相似的直播间。
本发明还提供一种基于主播风格的直播间推荐系统,包括:
数据采集模块,用于从服务器收集设定时间段内直播间的特征参数和用户数据,所述特征参数包括直播间的主播个人信息、房间信息和开播信息;还用于从服务器收集用户访问过的被推荐的直播间的数据;
特征向量构建模块,用于将每一个直播间的所述特征参数作为特征值,构建该直播间的特征向量;
判定模块,用于选取所述主播个人信息不相同的任意两个直播间,计算两个所述直播间的特征向量之间的相似度,依据得到的相似度的数值大小,判定相似的直播间;
推荐模块,用于根据每一个直播间的所述用户数据,将与该直播间相似的其它直播间推荐给该直播间的所有用户;
筛选模块,用于根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,使用评价指标对特征向量的特征值进行筛选,并使用筛选后的特征向量判定相似的直播间。
在上述技术方案的基础上,所述主播个人信息包括主播名称、主播昵称、主播性别和主播年龄,所述房间信息包括房间所在分区、房间标题和房间主题,所述开播信息包括开播次数、开播时段、每次开播时长和总开播时长。
在上述技术方案的基础上,所述相似度的计算依据公式:其中,X和Y分别为两个直播间的特征向量,X=(aX1,…,aXi,…,aXn),Y=(aY1,…,aYi,…,aYn),i=1,2,…,n,n为特征向量X和Y中特征值的总数,n为正整数,aXi和aYi分别表示特征向量X和Y的第i个特征值,Sim(X,Y)为特征向量X和Y的余弦相似度,X·Y为特征向量X和Y的内积,||X||和||Y||分别为特征向量X和Y的模。
在上述技术方案的基础上,所述预定的评价指标包括用户的平均访问率A和平均回访率B;
被推荐的直播间的访问率和/或回访率根据用户访问的被推荐的直播间的数量、被推荐的直播间总数、用户本次访问的上次被推荐的直播间的数量和用户本次访问的直播间总数计算得到;
所述平均访问率A的计算依据公式:
所述平均回访率B的计算依据公式:
其中,对于由访问被推荐的直播间的用户组成的任一个用户集合,m为所述用户集合中的用户总数,Aj和Bj分别为所述用户集合中第j个用户访问被推荐的直播间的访问率和回访率,j=1,2,…,m,所述被推荐的直播间为根据所述直播间的特征向量之间的相似度的数值大小判定为相似的直播间。
与现有技术相比,本发明的优点如下:
(1)本发明基于直播间的特征参数确定相似的直播间,该特征参数包括主播个人信息、房间信息和开播信息,直接反映了各直播间的主播的不同风格,而且向用户推荐与用户观看过的直播间相似的其它直播间,充分考虑到用户的行为和个性化需求,因此本方法能够实现向用户精准推荐主播风格相似的直播间,提升用户体验。
(2)本发明通过对特征向量中的特征值进行进一步筛选,剔除了无效的特征值,将筛选后的特征向量用于直播间推荐,因此,得到用于推荐的相似的直播间的计算量较小,计算所需时间较短,有效地提高了直播间的推荐效率。
(3)本发明根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,将筛选后的特征向量用于直播间推荐,因此,基于用户行为特征得到的筛选后的特征向量能够进一步提高推荐的准确率以及效率。
附图说明
图1是本发明实施例基于主播风格的直播间推荐方法流程图;
图2为图1中S5的具体流程图;
图3是本发明实施例基于主播风格的直播间推荐系统示意图。
附图标记:
数据采集模块1,特征向量构建模块2,判定模块3,推荐模块4,筛选模块5。
具体实施方式
下面结合附图及具体实施例对本发明作进一步的详细描述。
参见图1所示,本发明实施例提供一种基于主播风格的直播间推荐方法,包括以下步骤:
S1.从服务器收集设定时间段内直播间的特征参数和用户数据,特征参数包括直播间的主播个人信息、房间信息和开播信息。
主播个人信息包括主播名称、主播昵称、主播性别和主播年龄,房间信息包括房间所在分区、房间标题和房间主题,开播信息包括开播次数、开播时段、每次开播时长和总开播时长。
其中,设定时间段可根据网站业务需要灵活设定,可以为一周、一个月或三个月,每次开播时长和开播时段根据在设定时间段内从服务器采集的每次直播的开播时间和关播时间统计得到,开播时段可以为8:00-10:00、14:00-16:00等,总开播时长为设定时间段内每次开播时长的总和。对开播信息做进一步整理:除掉字段为空的数据,如没有记录的主播名称;除掉每次开播时长在3分钟以内的数据。
直播间的用户数据包括观看该直播间的所有用户的名称、地址和每次登录数据。
本发明基于直播间的特征参数确定相似的直播间,该特征参数充分反映出各直播间的主播的不同风格。
S2.将每一个直播间的特征参数作为特征值,构建该直播间的特征向量。
所有特征向量中的特征值均按照相同的顺序排列。
为了避免不同特征参数的量纲不同,对步骤S3中的相似度计算的结果造成影响,在构建该直播间的特征向量之前,对属于数值型的每个特征参数进行归一化处理,数值型的特征参数包括主播年龄、开播次数、开播时段、每次开播时长和总开播时长,归一化处理的计算依据公式:
ai=(ai’-Minvalue(ai’))/(Maxvalue(ai’)-Minvalue(ai’)),
其中,a'i表示直播间的第i个特征参数,i为正整数,Maxvalue(ai)和Minvalue(ai)分别表示所有直播间的第i个特征参数a'i的最大值和最小值,ai表示将a'i归一化后得到的值,ai在(0,1]之间,将ai作为直播间的特征向量的第i个特征值。
S3.选取主播个人信息不相同的任意两个直播间,计算两个直播间的特征向量之间的相似度,依据得到的相似度的数值大小,判定相似的直播间。
相似度的计算依据公式:其中,X和Y分别为两个直播间的特征向量,X=(aX1,…,aXi,…,aXn),Y=(aY1,…,aYi,…,aYn),i=1,2,…,n,n为特征向量X和Y中特征值的总数,n为正整数,aXi和aYi分别表示特征向量X和Y的第i个特征值,Sim(X,Y)为特征向量X和Y的余弦相似度,X·Y为特征向量X和Y的内积,||X||和||Y||分别为特征向量X和Y的模。
相似度Sim(X,Y)的数值越大,说明两个直播间的特征参数越相似,由于直播间的特征参数,主播个人信息、房间信息和开播信息,充分反映了各直播间的主播的风格,即说明这两个直播间的主播的风格越相似。
步骤S3中,依据得到的相似度的数值大小,判定相似的直播间包括:
对得到的所有相似度按照数值大小降序排列,获得相似度队列。
从相似度对列中按照由大至小的顺序选取预设数量的相似度的数值,将选取的每一个相似度的数值对应的两个直播间判定为相似的直播间。
例如,当预设数量设为10时,则从相似度对列中选取相似度的数值较大的前10个数值,将选取的每一个相似度的数值对应的两个直播间判定为相似的直播间。
S4.根据每一个直播间的用户数据,将与该直播间相似的其它直播间推荐给该直播间的所有用户。
本发明基于直播间的特征参数确定相似的直播间,该特征参数包括主播个人信息、房间信息和开播信息,直接反映了各直播间的主播的不同风格,而且向用户推荐与用户观看过的直播间相似的其它直播间,充分考虑到用户的行为和个性化需求,因此本方法能够实现向用户精准推荐主播风格相似的直播间,提升用户体验。
S5.根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,使用评价指标对特征向量的特征值进行筛选,并使用筛选后的特征向量判定相似的直播间。
预定的评价指标包括用户的平均访问率A和平均回访率B。
被推荐的直播间的访问率和/或回访率根据用户访问的被推荐的直播间的数量、被推荐的直播间总数、用户本次访问的上次被推荐的直播间的数量和用户本次访问的直播间总数计算得到。
平均访问率A的计算依据公式:
平均回访率B的计算依据公式:
其中,对于由访问被推荐的直播间的用户组成的任一个用户集合,m为用户集合中的用户总数,Aj和Bj分别为用户集合中第j个用户访问被推荐的直播间的访问率和回访率,j=1,2,…,m,被推荐的直播间为根据直播间的特征向量之间的相似度的数值大小判定为相似的直播间。
对于该用户集合,被推荐的直播间的访问率为被推荐的直播间的回访率为
收集用户访问的被推荐的直播间的数据在一个设定期间进行,例如向用户推荐直播间之后的一个月内。
平均访问率A和平均回访率B的数值越高,表示用户访问被推荐的直播间的数量越多,即推荐的效果越好。
参见图2所示,步骤S5具体包括:
S5.1将访问过被推荐的直播间的用户划分为用户数量相同的若干训练集,训练集的数量大于特征向量中特征值的总数n,n为正整数。
S5.2从当前使用的特征向量中删除任一个特征值,得到待筛选特征向量,对于任一个训练集,将当前使用的特征向量或任一个待筛选特征向量作为直播间的特征向量,计算相应的评价指标。
具体的,当前使用的特征向量中特征值的总数为n,从当前使用的特征向量中删除任一个特征值,得到n个待筛选特征向量,每一个待筛选特征向量均包括当前使用的特征向量的n个特征值中的n-1个特征值,且每一个待筛选特征向量包括的n-1个特征值不完全相同,例如,当前使用的特征向量X为X=(aX1,…,aXi,…,aXn),ai表示当前使用的特征向量X的第i个特征值,i=1,2,..,n,n为特征向量X和Y中特征值的总数,n为正整数,待筛选特征向量为(aX2,…,aXi,…,aXn),(aX1,aX3,…,aXi,…,aXn),……,(aX1,…,aXi,…,aXn-1)。
下面具体说明将当前使用的特征向量作为直播间的特征向量,计算得到对应于当前使用的特征向量的评价指标的数值的过程,同理可得到将待筛选特征向量作为直播间的特征向量,计算得到对应于当前使用的特征向量的评价指标的数值。
选取主播个人信息的数据不相同的任意两个直播间,计算两个直播间的当前使用的特征向量之间的相似度,依据得到的相似度的数值大小,判定相似的直播间。
相似度的计算依据公式:其中,X和Y分别为两个直播间的当前使用的特征向量,X=(aX1,…,aXi,…,aXn),Y=(aY1,…,aYi,…,aYn),i=1,2,…,n,n为当前使用的特征向量X和Y中特征值的总数,n为正整数,aXi和aYi分别表示当前使用的特征向量X和Y的第i个特征值,Sim(X,Y)为当前使用的特征向量X和Y的余弦相似度,X·Y为当前使用的特征向量X和Y的内积,||X||和||Y||分别为当前使用的特征向量X和Y的模。
对得到的所有相似度按照数值大小降序排列,获得相似度队列。
从相似度对列中按照由大至小的顺序选取预设数量的相似度的数值,将选取的每一个相似度的数值对应的两个直播间判定为相似的直播间。
对于任一个训练集,被推荐的直播间为根据直播间的当前使用的特征向量之间的相似度的数值大小判定为相似的直播间,然后根据该训练集中收集到的用户访问的被推荐的直播间的数据,即在该训练集中的用户访问的被推荐的直播间的数量、被推荐的直播间总数、用户本次访问的上次被推荐的直播间的数量和用户本次访问的直播间总数,计算得到评价指标的数值,即该训练集中用户的平均访问率A和平均回访率B。由于计算得到的评价指标是基于直播间的当前使用的特征向量,因此,计算得到的评价指标与当前使用的特征向量存在对应关系。
S5.3若任一个待筛选特征向量的评价指标的数值不小于当前使用的特征向量的评价指标的数值,则进入步骤S5.4;否则,进入步骤S5.5。
在比较时,任一个待筛选特征向量的平均访问率A和平均回访率B的数值均应不小于当前使用的特征向量的平均访问率A和平均回访率B的数值。
若任一个待筛选特征向量的评价指标的数值不小于当前使用的特征向量的评价指标的数值,说明从当前使用的特征向量中删除的特征值对平均访问率A和平均回访率B的数值没有影响,即删除的特征值是无效的特征值。
S5.4将数值最大的评价指标对应的待筛选特征向量替换为当前使用的特征向量,剔除使用过的训练集,进入步骤S5.2。
S5.5将当前使用的特征向量作为筛选后的特征向量判定相似的直播间。
计算主播个人信息不相同的任意两个直播间的筛选后的特征向量之间相似度,并将得到的所有相似度按照数值大小降序排列,获得相似度队列。
从相似度对列中按照由大至小的顺序选取预设数量的相似度的数值,将选取的每一个相似度的数值对应的两个直播间判定为相似的直播间,并向用户推荐相似的直播间。
本发明通过对特征向量中的特征值进行进一步筛选,剔除了无效的特征值,将筛选后的特征向量用于直播间推荐,因此,得到用于推荐的相似的直播间的计算量较小,计算所需时间较短,有效地提高了直播间的推荐效率。
本发明根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,将筛选后的特征向量用于直播间推荐,因此,基于用户行为特征得到的筛选后的特征向量能够进一步提高推荐的准确率以及效率。
参见图3所示,本发明还提供一种基于主播风格的直播间推荐系统,包括数据采集模块1、特征向量构建模块2、判定模块3、推荐模块4和筛选模块5。
数据采集模块1用于从服务器收集设定时间段内直播间的特征参数和用户数据,特征参数包括直播间的主播个人信息、房间信息和开播信息;还用于从服务器收集用户访问的被推荐的直播间的数据。
主播个人信息包括主播名称、主播昵称、主播性别和主播年龄,房间信息包括房间所在分区、房间标题和房间主题,开播信息包括开播次数、开播时段、每次开播时长和总开播时长。
特征向量构建模块2用于将每一个直播间的特征参数作为特征值,构建该直播间的特征向量。
所有特征向量中的特征值均按照相同的顺序排列。
判定模块3用于选取主播个人信息不相同的任意两个直播间,计算两个直播间的特征向量之间的相似度,依据得到的相似度的数值大小,判定相似的直播间。
相似度的计算依据公式:其中,X和Y分别为两个直播间的特征向量,X=(aX1,…,aXi,…,aXn),Y=(aY1,…,aYi,…,aYn),i=1,2,…,n,n为特征向量X和Y中特征值的总数,n为正整数,aXi和aYi分别表示特征向量X和Y的第i个特征值,Sim(X,Y)为特征向量X和Y的余弦相似度,X·Y为特征向量X和Y的内积,||X||和||Y||分别为特征向量X和Y的模。
推荐模块4用于根据每一个直播间的用户数据,将与该直播间相似的其它直播间推荐给该直播间的所有用户。
筛选模块5用于根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,使用评价指标对特征向量的特征值进行筛选,并使用筛选后的特征向量判定相似的直播间。
预定的评价指标包括用户的平均访问率A和平均回访率B。
被推荐的直播间的访问率和/或回访率根据用户访问的被推荐的直播间的数量、被推荐的直播间总数、用户本次访问的上次被推荐的直播间的数量和用户本次访问的直播间总数计算得到。
平均访问率A的计算依据公式:
平均回访率B的计算依据公式:
其中,对于由访问被推荐的直播间的用户组成的任一个用户集合,m为用户集合中的用户总数,Aj和Bj分别为用户集合中第j个用户访问被推荐的直播间的访问率和回访率,j=1,2,…,m,被推荐的直播间为根据直播间的特征向量之间的相似度的数值大小判定为相似的直播间。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (10)

1.一种基于主播风格的直播间推荐方法,其特征在于,包括步骤:
S1.从服务器收集设定时间段内直播间的特征参数和用户数据,所述特征参数包括直播间的主播个人信息、房间信息和开播信息;
S2.将每一个直播间的所述特征参数作为特征值,构建该直播间的特征向量;
S3.选取所述主播个人信息不相同的任意两个直播间,计算两个所述直播间的特征向量之间的相似度,依据得到的相似度的数值大小,判定相似的直播间;
S4.根据每一个直播间的所述用户数据,将与该直播间相似的其它直播间推荐给该直播间的所有用户;
S5.根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,使用评价指标对特征向量的特征值进行筛选,并使用筛选后的特征向量判定相似的直播间。
2.如权利要求1所述的基于主播风格的直播间推荐方法,其特征在于:所述主播个人信息包括主播名称、主播昵称、主播性别和主播年龄,所述房间信息包括房间所在分区、房间标题和房间主题,所述开播信息包括开播次数、开播时段、每次开播时长和总开播时长。
3.如权利要求1所述的基于主播风格的直播间推荐方法,其特征在于:步骤S3中,所述相似度的计算依据公式:其中,X和Y分别为两个直播间的特征向量,X=(aX1,…,aXi,…,aXn),Y=(aY1,…,aYi,…,aYn),i=1,2,…,n,n为特征向量X和Y中特征值的总数,n为正整数,aXi和aYi分别表示特征向量X和Y的第i个特征值,Sim(X,Y)为特征向量X和Y的余弦相似度,X·Y为特征向量X和Y的内积,||X||和||Y||分别为特征向量X和Y的模。
4.如权利要求1所述的基于主播风格的直播间推荐方法,其特征在于,步骤S3中,判定相似的直播间的方法为:
对得到的所有相似度按照数值大小降序排列,获得相似度队列;
从所述相似度对列中按照至由大至小的顺序选取预设数量的相似度的数值,将选取的每一个相似度的数值对应的两个直播间判定为相似的直播间。
5.如权利要求1所述的基于主播风格的直播间推荐方法,其特征在于:步骤S5中,所述评价指标包括用户的平均访问率A和平均回访率B;
被推荐的直播间的访问率和/或回访率根据用户访问的被推荐的直播间的数量、被推荐的直播间总数、用户本次访问的上次被推荐的直播间的数量和用户本次访问的直播间总数计算得到;
所述平均访问率A的计算依据公式:
所述平均回访率B的计算依据公式:
其中,对于由访问被推荐的直播间的用户组成的任一个用户集合,m为所述用户集合中的用户总数,Aj和Bj分别为所述用户集合中第j个用户访问被推荐的直播间的访问率和回访率,j=1,2,…,m,所述被推荐的直播间为根据所述直播间的特征向量之间的相似度的数值大小判定为相似的直播间。
6.如权利要求5所述的基于主播风格的直播间推荐方法,其特征在于,步骤S5具体包括:
S5.1将访问过被推荐的直播间的用户划分为用户数量相同的若干训练集,所述训练集的数量大于所述特征向量中特征值的总数n,n为正整数;
S5.2从当前使用的特征向量中删除任一个特征值,得到待筛选特征向量,对于任一个所述训练集,将当前使用的特征向量或任一个待筛选特征向量作为所述直播间的特征向量,计算相应的评价指标;
S5.3若任一个所述待筛选特征向量的评价指标的数值不小于当前使用的特征向量的评价指标的数值,则进入步骤S5.4;否则,进入步骤S5.5;
S5.4将数值最大的评价指标对应的所述待筛选特征向量替换为当前使用的特征向量,剔除使用过的所述训练集,进入步骤S5.2;
S5.5将所述当前使用的特征向量作为筛选后的特征向量判定相似的直播间。
7.一种基于权利要求1所述方法的直播间推荐系统,其特征在于,包括:
数据采集模块,用于从服务器收集设定时间段内直播间的特征参数和用户数据,所述特征参数包括直播间的主播个人信息、房间信息和开播信息;还用于从服务器收集用户访问过的被推荐的直播间的数据;
特征向量构建模块,用于将每一个直播间的所述特征参数作为特征值,构建该直播间的特征向量;
判定模块,用于选取所述主播个人信息不相同的任意两个直播间,计算两个所述直播间的特征向量之间的相似度,依据得到的相似度的数值大小,判定相似的直播间;
推荐模块,用于根据每一个直播间的所述用户数据,将与该直播间相似的其它直播间推荐给该直播间的所有用户;
筛选模块,用于根据被推荐的直播间的访问率和/或回访率计算特征向量的评价指标,使用评价指标对特征向量的特征值进行筛选,并使用筛选后的特征向量判定相似的直播间。
8.如权利要求7所述的直播间推荐系统,其特征在于:
所述主播个人信息包括主播名称、主播昵称、主播性别和主播年龄,所述房间信息包括房间所在分区、房间标题和房间主题,所述开播信息包括开播次数、开播时段、每次开播时长和总开播时长。
9.如权利要求7所述的直播间推荐系统,其特征在于:所述相似度的计算依据公式:其中,X和Y分别为两个直播间的特征向量,X=(aX1,…,aXi,…,aXn),Y=(aY1,…,aYi,…,aYn),i=1,2,…,n,n为特征向量X和Y中特征值的总数,n为正整数,aXi和aYi分别表示特征向量X和Y的第i个特征值,Sim(X,Y)为特征向量X和Y的余弦相似度,X·Y为特征向量X和Y的内积,||X||和||Y||分别为特征向量X和Y的模。
10.如权利要求7所述的直播间推荐系统,其特征在于:所述预定的评价指标包括用户的平均访问率A和平均回访率B;
被推荐的直播间的访问率和/或回访率根据用户访问的被推荐的直播间的数量、被推荐的直播间总数、用户本次访问的上次被推荐的直播间的数量和用户本次访问的直播间总数计算得到;
所述平均访问率A的计算依据公式:
所述平均回访率B的计算依据公式:
其中,对于由访问被推荐的直播间的用户组成的任一个用户集合,m为所述用户集合中的用户总数,Aj和Bj分别为所述用户集合中第j个用户访问被推荐的直播间的访问率和回访率,j=1,2,…,m,所述被推荐的直播间为根据所述直播间的特征向量之间的相似度的数值大小判定为相似的直播间。
CN201610846016.3A 2016-09-23 2016-09-23 一种基于主播风格的直播间推荐方法及系统 Pending CN106560811A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610846016.3A CN106560811A (zh) 2016-09-23 2016-09-23 一种基于主播风格的直播间推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610846016.3A CN106560811A (zh) 2016-09-23 2016-09-23 一种基于主播风格的直播间推荐方法及系统

Publications (1)

Publication Number Publication Date
CN106560811A true CN106560811A (zh) 2017-04-12

Family

ID=58485721

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610846016.3A Pending CN106560811A (zh) 2016-09-23 2016-09-23 一种基于主播风格的直播间推荐方法及系统

Country Status (1)

Country Link
CN (1) CN106560811A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107071501A (zh) * 2017-04-25 2017-08-18 北京潘达互娱科技有限公司 直播间显示方法及装置
CN107404656A (zh) * 2017-06-26 2017-11-28 武汉斗鱼网络科技有限公司 直播视频推荐方法、装置及服务器
CN107483982A (zh) * 2017-07-11 2017-12-15 北京潘达互娱科技有限公司 一种主播推荐方法与装置
CN107613395A (zh) * 2017-08-28 2018-01-19 武汉斗鱼网络科技有限公司 直播房间推荐方法及系统
CN107835441A (zh) * 2017-10-10 2018-03-23 武汉斗鱼网络科技有限公司 基于路径预测的直播推荐方法、存储介质、设备及系统
CN107992526A (zh) * 2017-11-10 2018-05-04 广州虎牙信息科技有限公司 主播推荐方法、存储设备及计算机设备
CN108519991A (zh) * 2018-02-28 2018-09-11 北京奇艺世纪科技有限公司 一种主播账户推荐的方法和装置
CN108521588A (zh) * 2018-04-18 2018-09-11 武汉斗鱼网络科技有限公司 一种基于时间分片的主播排名方法及系统、服务器及存储介质
CN109241242A (zh) * 2018-08-23 2019-01-18 武汉斗鱼网络科技有限公司 一种直播间话题推荐方法、装置、服务器及存储介质
CN109348262A (zh) * 2018-10-19 2019-02-15 广州虎牙科技有限公司 一种主播相似度的计算方法、装置、设备和存储介质
CN109462778A (zh) * 2018-11-15 2019-03-12 武汉斗鱼网络科技有限公司 一种直播标识的推荐方法以及相关设备
CN109618193A (zh) * 2018-12-18 2019-04-12 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109977264A (zh) * 2019-02-19 2019-07-05 武汉斗鱼鱼乐网络科技有限公司 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质
CN110012320A (zh) * 2018-01-05 2019-07-12 武汉斗鱼网络科技有限公司 直播间的标签适配方法、存储介质、电子设备及系统
CN110475132A (zh) * 2019-08-21 2019-11-19 广州虎牙科技有限公司 直播间类型识别方法、装置及数据处理设备
CN110730385A (zh) * 2018-07-16 2020-01-24 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、服务器及存储介质
CN111010584A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 直播数据处理方法、装置、服务器和存储介质
CN111083503A (zh) * 2018-10-22 2020-04-28 武汉斗鱼网络科技有限公司 对直播间计算相似度的方法、装置、设备和存储介质

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107071501A (zh) * 2017-04-25 2017-08-18 北京潘达互娱科技有限公司 直播间显示方法及装置
CN107404656A (zh) * 2017-06-26 2017-11-28 武汉斗鱼网络科技有限公司 直播视频推荐方法、装置及服务器
CN107483982A (zh) * 2017-07-11 2017-12-15 北京潘达互娱科技有限公司 一种主播推荐方法与装置
CN107483982B (zh) * 2017-07-11 2020-08-21 北京潘达互娱科技有限公司 一种主播推荐方法与装置
WO2019041706A1 (zh) * 2017-08-28 2019-03-07 武汉斗鱼网络科技有限公司 直播房间推荐方法及系统
CN107613395A (zh) * 2017-08-28 2018-01-19 武汉斗鱼网络科技有限公司 直播房间推荐方法及系统
CN107613395B (zh) * 2017-08-28 2019-11-15 武汉斗鱼网络科技有限公司 直播房间推荐方法、系统、设备及存储介质
CN107835441A (zh) * 2017-10-10 2018-03-23 武汉斗鱼网络科技有限公司 基于路径预测的直播推荐方法、存储介质、设备及系统
CN107835441B (zh) * 2017-10-10 2020-01-03 武汉斗鱼网络科技有限公司 基于路径预测的直播推荐方法、存储介质、设备及系统
WO2019071831A1 (zh) * 2017-10-10 2019-04-18 武汉斗鱼网络科技有限公司 基于路径预测的直播推荐方法、存储介质、设备及系统
CN107992526A (zh) * 2017-11-10 2018-05-04 广州虎牙信息科技有限公司 主播推荐方法、存储设备及计算机设备
CN110012320B (zh) * 2018-01-05 2021-02-02 武汉斗鱼网络科技有限公司 直播间的标签适配方法、存储介质、电子设备及系统
CN110012320A (zh) * 2018-01-05 2019-07-12 武汉斗鱼网络科技有限公司 直播间的标签适配方法、存储介质、电子设备及系统
CN108519991A (zh) * 2018-02-28 2018-09-11 北京奇艺世纪科技有限公司 一种主播账户推荐的方法和装置
CN108521588B (zh) * 2018-04-18 2020-10-16 武汉斗鱼网络科技有限公司 基于时间分片的主播排名方法及系统、服务器及存储介质
CN108521588A (zh) * 2018-04-18 2018-09-11 武汉斗鱼网络科技有限公司 一种基于时间分片的主播排名方法及系统、服务器及存储介质
CN110730385A (zh) * 2018-07-16 2020-01-24 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、服务器及存储介质
CN109241242A (zh) * 2018-08-23 2019-01-18 武汉斗鱼网络科技有限公司 一种直播间话题推荐方法、装置、服务器及存储介质
CN109348262B (zh) * 2018-10-19 2021-08-13 广州虎牙科技有限公司 一种主播相似度的计算方法、装置、设备和存储介质
CN109348262A (zh) * 2018-10-19 2019-02-15 广州虎牙科技有限公司 一种主播相似度的计算方法、装置、设备和存储介质
CN111083503A (zh) * 2018-10-22 2020-04-28 武汉斗鱼网络科技有限公司 对直播间计算相似度的方法、装置、设备和存储介质
CN111083503B (zh) * 2018-10-22 2022-02-22 武汉斗鱼网络科技有限公司 对直播间计算相似度的方法、装置、设备和存储介质
CN109462778B (zh) * 2018-11-15 2020-10-16 武汉斗鱼网络科技有限公司 一种直播标识的推荐方法以及相关设备
CN109462778A (zh) * 2018-11-15 2019-03-12 武汉斗鱼网络科技有限公司 一种直播标识的推荐方法以及相关设备
CN109618193A (zh) * 2018-12-18 2019-04-12 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109618193B (zh) * 2018-12-18 2021-06-25 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109977264A (zh) * 2019-02-19 2019-07-05 武汉斗鱼鱼乐网络科技有限公司 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质
CN109977264B (zh) * 2019-02-19 2022-09-09 武汉斗鱼鱼乐网络科技有限公司 一种基于元路径相似度的用户推荐方法、系统、服务器及存储介质
CN110475132A (zh) * 2019-08-21 2019-11-19 广州虎牙科技有限公司 直播间类型识别方法、装置及数据处理设备
CN111010584A (zh) * 2019-12-05 2020-04-14 网易(杭州)网络有限公司 直播数据处理方法、装置、服务器和存储介质

Similar Documents

Publication Publication Date Title
CN106560811A (zh) 一种基于主播风格的直播间推荐方法及系统
WO2020248508A1 (zh) 广告渠道的评估方法、装置、设备和存储介质
CN104205158B (zh) 测量在线观众的系统、方法和产品
CN103489117B (zh) 信息投放方法和系统
CN103729446B (zh) 一种用户操作数据的处理方法、处理装置及服务器
CN110324662A (zh) 一种视频封面生成方法及装置
CN103353920B (zh) 基于社交网络推荐游戏的方法和装置
CN106294508A (zh) 一种刷量工具检测方法及装置
CN102752123B (zh) 网络设备接口流量预测和容量配置方法及装置
CN103761228B (zh) 应用程序的排名阈值确定方法和排名阈值确定系统
CN107592346A (zh) 基于用户行为分析的用户分类方法
CN108132964A (zh) 一种基于用户对项目类评分的协同过滤方法
CN110166344A (zh) 一种身份标识识别方法、装置以及相关设备
CN107645667A (zh) 视频推荐方法、系统及服务器设备
CN101500017A (zh) 一种基于流量提供业务的方法及其系统
CN110287399A (zh) 直播信息处理方法、装置、电子设备及存储介质
CN107529093A (zh) 一种视频文件播放量的检测方法及系统
Andrews et al. Calculating the benefits of sponsored data for an individual content provider
CN110895594A (zh) 一种页面展示的方法以及相关设备
CN105843876A (zh) 多媒体资源的质量评估方法和装置
CN101408966A (zh) 一种通过网络进行品牌评价或问卷调查的方法及系统
CN103593355A (zh) 用户原创内容的推荐方法及推荐装置
CN106534984A (zh) 电视节目推送方法及装置
CN109816004A (zh) 房源图片分类方法、装置、设备及存储介质
CN108459936B (zh) 一种基于内容模块化的精准统计方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170412

RJ01 Rejection of invention patent application after publication