CN109361929B - 一种确定直播间标签的方法以及相关设备 - Google Patents

一种确定直播间标签的方法以及相关设备 Download PDF

Info

Publication number
CN109361929B
CN109361929B CN201811137711.8A CN201811137711A CN109361929B CN 109361929 B CN109361929 B CN 109361929B CN 201811137711 A CN201811137711 A CN 201811137711A CN 109361929 B CN109361929 B CN 109361929B
Authority
CN
China
Prior art keywords
live broadcast
tag
content
score
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811137711.8A
Other languages
English (en)
Other versions
CN109361929A (zh
Inventor
王璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201811137711.8A priority Critical patent/CN109361929B/zh
Publication of CN109361929A publication Critical patent/CN109361929A/zh
Application granted granted Critical
Publication of CN109361929B publication Critical patent/CN109361929B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种确定直播间标签的方法及相关设备,可以快速准确地确定新直播间的标签。该方法包括:获取目标直播间;获取直播平台的内容标签集合;确定第一直播间对内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合;根据第一标签得分集合计算目标用户对内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合;根据偏好得分集合计算目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;将目标标签子集确定为目标直播间的标签,目标标签子集为第二标签得分集合中分数大于预设阈值的得分对应的内容标签,目标标签子集中至少包括一个内容标签。

Description

一种确定直播间标签的方法以及相关设备
技术领域
本发明涉及直播领域,尤其涉及一种确定直播间标签的方法以及相关设备。
背景技术
随着网络通信技术的进步和宽带网络的提速,视频直播技术得到了越来越多的发展和应用。
在直播平台上经常会出现新的直播间,这些直播间对用户而言具有一定的新颖性,因此在直播间推荐的时候希望能够及时将这些新直播间推荐给用户,一种非常重要的推荐策略是基于标签的推荐,但是,由于新直播间的信息较少,很难在短时间内及时获取到相应的标签。
发明内容
本发明实施例提供了一种确定直播间标签的方法以及相关设备,可以快速准确地确定新直播间的标签。
本发明实施例的第一方面提供了一种确定直播间标签的方法,包括:
获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;
获取所述直播平台的内容标签集合;
确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签。
可选地,所述确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到所述第一标签得分集合包括:
通过如下公式计算所述第一直播间对所述内容标签集合中的每个内容标签的标签得分,得到所述第一标签得分集合:
Figure BDA0001815052000000021
其中,srl为所述第一直播间r对所述内容标签集合中的第l个内容标签的得分,wli所述第l个内容标签下的标签关联词集合,所述wli包括词语wl1,wl2,...,wlm,wi是所述第l个内容标签下的弹幕文本词语集合,所述w包含词语w1,w2,...,wn,Nr(wli)为所述第一直播间r的弹幕文本中出现标签关联词wli的次数,Nr(wi)是所述第一直播间r的弹幕文本中出现弹幕文本词wi的次数,#R为所述直播平台中的直播间的总个数,#R(wl)为所述直播平台中的所有直播间中的弹幕文本中含有标签关联词集合wli中词语的直播间个数。
可选地,所述根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合包括:
基于所述第一标签得分集合通过如下公式计算所述目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到所述偏好得分集合:
Figure BDA0001815052000000031
其中,wr(u)是所述目标用户u在预设时长内对所述第一直播间r的观看时长,R为所述直播平台中的全部直播间的集合,L为所述内容标签集合,l为所述内容标签集合L中的第l个内容标签;所述第一直播间r为所述直播平台中的任意一个直播间,srl为所述直播间r对所述第l个内容标签的标签内容得分,pul为所述目标用户u对所述第l个内容标签的偏好得分。
可选地,所述根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合包括:
基于所述偏好得分集合通过如下公式计算所述目标直播间对所述内容标签集合中的每个内容标签的标签得分,以得到所述第二标签得分集合:
Figure BDA0001815052000000032
其中,r为所述目标直播间,ur为所述直播平台中观看所述目标直播间r的用户集合,u为所述ur中的任意一个用户,cur所述u对所述目标直播间r的观看次数,pui为所述用户u对所述第i个内容标签的偏好得分,i为所述内容标签集合中的第i个内容标签,||pui||2为所述pui的L2范数,
Figure BDA0001815052000000041
sri为所述目标直播间r对所述第i个内容标签的标签得分。
本发明实施例第二方面提供了一种确定直播间标签的装置,包括:
获取单元,用于获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;
所述获取单元,还用于获取所述直播平台的内容标签集合;
第一确定单元,用于确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
第一计算单元,用于根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
第二计算单元,用于根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
第二确定单元,用于将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签。
可选地,所述第一确定单元具体用于:
通过如下公式计算所述第一直播间对所述内容标签集合中的每个内容标签的标签得分,得到所述第一标签得分集合:
Figure BDA0001815052000000051
其中,srl为所述第一直播间r对所述内容标签集合中的第l个内容标签的得分,wli所述第l个内容标签下的标签关联词集合,所述wli包括词语wl1,wl2,...,wlm,wi是所述第l个内容标签下的弹幕文本词语集合,所述w包含词语w1,w2,...,wn,Nr(wli)为所述第一直播间r的弹幕文本中出现标签关联词wli的次数,Nr(wi)是所述第一直播间r的弹幕文本中出现弹幕文本词wi的次数,#R为所述直播平台中的直播间的总个数,#R(wl)为所述直播平台中的所有直播间中的弹幕文本中含有标签关联词集合wli中词语的直播间个数。
可选地,所述第一计算单元具体用于:
基于所述第一标签得分集合通过如下公式计算所述目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到所述偏好得分集合:
Figure BDA0001815052000000061
其中,wr(u)是所述目标用户u在预设时长内对所述第一直播间r的观看时长,R为所述直播平台中的全部直播间的集合,L为所述内容标签集合,l为所述内容标签集合L中的第l个内容标签;所述第一直播间r为所述直播平台中的任意一个直播间,srl为所述直播间r对所述第l个内容标签的标签内容得分,pul为所述目标用户u对所述第l个内容标签的偏好得分。
可选地,所述第二计算单元具体用于:
基于所述偏好得分集合通过如下公式计算所述目标直播间对所述内容标签集合中的每个内容标签的标签得分,以得到所述第二标签得分集合:
Figure BDA0001815052000000062
其中,r为所述目标直播间,ur为所述直播平台中观看所述目标直播间r的用户集合,u为所述ur中的任意一个用户,cur所述u对所述目标直播间r的观看次数,pui为所述用户u对所述第i个内容标签的偏好得分,i为所述内容标签集合中的第i个内容标签,||pui||2为所述pui的L2范数,
Figure BDA0001815052000000071
sri为所述目标直播间r对所述第i个内容标签的标签得分。
本发明第三方面提供了一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如上述任意一项所述的确定直播间标签的方法的步骤。
本发明第四方面提供了一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如上述任意一项所述的确定直播间标签的方法的步骤。
综上所述,本发明提供的实施例中,通过直播平台中满足预设条件的直播间确定出第一标签得分集合,并根据第一标签得分集合计算目标用户对内容标签集合中的每个内容标签的偏好得分,得到偏好得分集合,进而通过偏好得分集合计算目标直播间对内容标签集合中的每个内容标签的标签得分,得到第二标签得分集合,将第二标签得分集合中分数大于预设阈值的得分对应的内容标签确定为目标直播间的标签,这样可以快速准确的确定出直播平台中新开设的直播间的标签,进而根据该标签向用户进行推荐。
附图说明
图1为本发明实施例提供的一种确定直播间标签的方法的流程示意图;
图2为本发明实施例提供的一种确定直播间标签的装置的实施例示意图;
图3为本发明实施例提供的一种确定直播间标签的装置的硬件结构示意图;
图4为本发明实施例提供的一种电子设备的实施例示意图;
图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
具体实施方式
本发明实施例提供了一种确定直播间标签的方法和相关设备,可以快速准确地确定新直播间的标签。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
下面从确定直播间标签的装置的角度对确定直播间标签的方法进行说明,该确定直播间标签的装置可以为服务器,也可以为服务器中的服务单元。
请参阅图1,图1为本发明实施例提供的确定直播间标签的方法的实施例示意图,包括:
101、获取目标直播间。
本实施例中,确定直播间标签的装置可以获取到目标直播间,该目标直播间为直播平台中不满足预设条件的直播间,也即直播平台中新开设的直播间。
需要说明的是,该预设条件例如是开播时间为一个月,又例如,该预设条件为关注直播间的人数达到一个预设值等等具体不做限定,只需要能将直播平台中新开设的直播间与老的直播间区别开即可,也即该新开设的直播间为不满足预设条件的直播间,老的直播间为满足预设条件的直播间。
102、获取直播平台的内容标签集合。
本实施例中,直播间对标签的画像是根据直播间的弹幕文本中提取并得到的,由此,确定直播间标签的装置可以获取直播平台的内容标签集合。例如可以获取一个主题对应的所有内容标签的集合,也可以获取直播平台中的所有主题对应的内容标签集合,该内容标签集合至需要包括待确定标签的直播间对应的主题即可,具体不做限定,例如该带确定标签的直播间为游戏类的直播间,那么就只需要获取游戏类主题对应的直播间的内容标签集合即可,当然也还可以获取其他主题对应的内容标签集合,具体不做限定
103、确定第一直播间对内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合。
本实施例中,确定直播间标签的装置可以计算第一直播间对内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,该第一直播间为直播平台中满足预设条件的任意一个直播间,具体如下:
通过如下公式计算第一直播间对内容标签集合中的每个内容标签的标签得分,得到第一标签得分集合:
Figure BDA0001815052000000091
其中,srl为第一直播间r对内容标签集合中的第l个内容标签的得分,wli第l个内容标签下的标签关联词集合,wli包括词语wl1,wl2,...,wlm,wi是第l个内容标签下的弹幕文本词语集合,w包含词语w1,w2,...,wn,Nr(wli)为第一直播间r的弹幕文本中出现标签关联词wli的次数,Nr(wi)是第一直播间r的弹幕文本中出现弹幕文本词wi的次数,#R为直播平台中的直播间的总个数,#R(wl)为直播平台中的所有直播间中的弹幕文本中含有标签关联词集合wli中词语的直播间个数。
可以理解的是,综合各个标签的得分可以得到第一直播间r的内容标签得分向量sr=(sr1,sr2,...,srK)。
下面结合例子进行说明:
假设直播间r的弹幕文本出现的总词数是1000,出现与内容标签集合中的标签l1关联词的总词数是20,全网直播间的个数是10000,其中弹幕中含有与标签l1关联词的直播间个数是200,那么将上述数值带入公式中即可计算出,直播间r对内容标签l1的得分:
Figure BDA0001815052000000101
103、根据第一标签得分集合计算目标用户对内容标签集合的每个内容标签的偏好得分,以得到偏好得分集合。
本实施例中,确定直播间标签的方法可以根据第一标签得分集合计算目标用户对内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,其中该目标用户为观看过目标直播间的用户集合中的任意一个用户。具体如下:
基于第一标签得分集合通过如下公式计算目标用户对内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合:
Figure BDA0001815052000000102
其中,wr(u)是目标用户u在预设时长内对第一直播间r的观看时长,R为直播平台中的全部直播间的集合,L为内容标签集合,l为内容标签集合L中的第l个内容标签;第一直播间r为所述直播平台中的任意一个直播间,srl为第一直播间r对第l个内容标签的标签内容得分,pul为用户u对所述第l个内容标签的偏好得分。
可以理解的是,计算目标用户u对各个标签的偏好可以得到目标用户u对内容标签集合中的每个内容标签的偏好得分向量pu=(pu1,pu2,...,puK),其中K为内容标签集合中的内容标签的个数。
105、根据偏好得分集合计算目标直播间对内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合。
本实施例中,确定直播间标签的装置可以根据偏好得分集合计算目标直播间对内容标签集合中的每个内容内容标签的标签得分,以得到第二标签得分集合,具体如下:
基于偏好得分集合通过如下公式计算目标直播间对内容标签集合中的每个内容标签的标签得分,以得到第二标签得分集合:
Figure BDA0001815052000000111
其中,r为目标直播间,ur为直播平台中观看目标直播间r的用户集合,u为所述ur中的任意一个用户,cur所述u对目标直播间r的观看次数,pui为用户u对第i个内容标签的偏好得分,i为内容标签集合中的第i个内容标签,||pui||2为pui的L2范数,
Figure BDA0001815052000000121
sri为目标直播间r对第i个内容标签的标签得分。
106、将目标标签子集确定为目标直播间的标签。
本实施例中,在计算得到目标直播间对内容标签集合中的每个内容标签的标签得分之后,可以将目标标签子集确定为目标直播间的标签,其中,该目标标签子集为第二标签得分集合中分数大于预设阈值的得分对应的内容标签的集合所形成的集合,该目标标签子集中至少包括一个内容标签。
需要说明的是,可以将目标直播间对内容标签集合中的每个内容标签的标签得分进行排序,选取最高的5个得分对应的标签作为目标直播间的标签。
综上所述,本发明提供的实施例中,通过直播平台中满足预设条件的直播间确定出第一标签得分集合,并根据第一标签得分集合计算目标用户对内容标签集合中的每个内容标签的偏好得分,得到偏好得分集合,进而通过偏好得分集合计算目标直播间对内容标签集合中的每个内容标签的标签得分,得到第二标签得分集合,将第二标签得分集合中分数大于预设阈值的得分对应的内容标签确定为目标直播间的标签,这样可以快速准确的确定出直播平台中新开设的直播间的标签,进而根据该标签向用户进行推荐。
上面对本发明实施例中确定直播间标签的方法进行了描述,下面对本发明实施例中的确定直播间标签的装置进行描述。
请参阅图2,本发明实施例中确定直播间标签的装置的一个实施例,包括:
获取单元201,用于获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;
所述获取单元201,还用于获取所述直播平台的内容标签集合;
第一确定单元202,用于确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
第一计算单元203,用于根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
第二计算单元204,用于根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
第二确定单元205,用于将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签。
可选地,所述第一确定单元202具体用于:
通过如下公式计算所述第一直播间对所述内容标签集合中的每个内容标签的标签得分,得到所述第一标签得分集合:
Figure BDA0001815052000000131
其中,srl为所述第一直播间r对所述内容标签集合中的第l个内容标签的得分,wli所述第l个内容标签下的标签关联词集合,所述wli包括词语wl1,wl2,...,wlm,wi是所述第l个内容标签下的弹幕文本词语集合,所述w包含词语w1,w2,...,wn,Nr(wli)为所述第一直播间r的弹幕文本中出现标签关联词wli的次数,Nr(wi)是所述第一直播间r的弹幕文本中出现弹幕文本词wi的次数,#R为所述直播平台中的直播间的总个数,#R(wl)为所述直播平台中的所有直播间中的弹幕文本中含有标签关联词集合wli中词语的直播间个数。
可选地,所述第一计算单元203具体用于:
基于所述第一标签得分集合通过如下公式计算所述目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到所述偏好得分集合:
Figure BDA0001815052000000141
其中,wr(u)是所述目标用户u在预设时长内对所述第一直播间r的观看时长,R为所述直播平台中的全部直播间的集合,L为所述内容标签集合,l为所述内容标签集合L中的第l个内容标签;所述第一直播间r为所述直播平台中的任意一个直播间,srl为所述直播间r对所述第l个内容标签的标签内容得分,pul为所述目标用户u对所述第l个内容标签的偏好得分。
可选地,所述第二计算单元204具体用于:
基于所述偏好得分集合通过如下公式计算所述目标直播间对所述内容标签集合中的每个内容标签的标签得分,以得到所述第二标签得分集合:
Figure BDA0001815052000000151
其中,r为所述目标直播间,ur为所述直播平台中观看所述目标直播间r的用户集合,u为所述ur中的任意一个用户,cur所述u对所述目标直播间r的观看次数,pui为所述用户u对所述第i个内容标签的偏好得分,i为所述内容标签集合中的第i个内容标签,||pui||2为所述pui的L2范数,
Figure BDA0001815052000000152
sri为所述目标直播间r对所述第i个内容标签的标签得分。
上面图2从模块化功能实体的角度对本发明实施例中的确定直播间标签的装置进行了描述,下面从硬件处理的角度对本发明实施例中的确定直播间标签的装置进行详细描述,请参阅图3,本发明实施例中的确定直播间标签的装置300一个实施例,包括:
输入装置301、输出装置302、处理器303和存储器304(其中处理器303的数量可以一个或多个,图3中以一个处理器303为例)。在本发明的一些实施例中,输入装置301、输出装置502、处理器303和存储器304可通过总线或其它方式连接,其中,图3中以通过总线连接为例。
其中,通过调用存储器304存储的操作指令,处理器303,用于执行如下步骤:
获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;
获取所述直播平台的内容标签集合;
确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签。
通过调用存储器304存储的操作指令,处理器303,还用于执行图1对应的实施例中的任一方式。
请参阅图4,图4为本发明实施例提供的电子设备的实施例示意图。
如图4所示,本发明实施例提供了一种电子设备,包括存储器410、处理器420及存储在存储器420上并可在处理器420上运行的计算机程序411,处理器420执行计算机程序411时实现以下步骤:
获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;
获取所述直播平台的内容标签集合;
确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签。
在具体实施过程中,处理器420执行计算机程序411时,可以实现图1对应的实施例中任一实施方式。
由于本实施例所介绍的电子设备为实施本发明实施例中一种确定直播间标签的装置所采用的设备,故而基于本发明实施例中所介绍的方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍,只要本领域所属技术人员实施本发明实施例中的方法所采用的设备,都属于本发明所欲保护的范围。
请参阅图5,图5为本发明实施例提供的一种计算机可读存储介质的实施例示意图。
如图5所示,本实施例提供了一种计算机可读存储介质500,其上存储有计算机程序511,该计算机程序511被处理器执行时实现如下步骤:
获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;
获取所述直播平台的内容标签集合;
确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签。
在具体实施过程中,该计算机程序511被处理器执行时可以实现图1对应的实施例中任一实施方式。
需要说明的是,在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其它实施例的相关描述。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式计算机或者其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机软件指令,当计算机软件指令在处理设备上运行时,使得处理设备执行如图1对应实施例中的风电场数字化平台设计的方法中的流程。
所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修该,或者对其中部分技术特征进行等同替换;而这些修该或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种确定直播间标签的方法,其特征在于,包括:
获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;所述预设条件用于区别直播平台中新开设的直播间与老的直播间,所述新开设的直播间为不满足预设条件的直播间,所述老的直播间为满足预设条件的直播间;
获取所述直播平台的内容标签集合;
确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签;
所述确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到所述第一标签得分集合包括:
通过如下公式计算所述第一直播间对所述内容标签集合中的每个内容标签的标签得分,得到所述第一标签得分集合:
Figure FDA0002999514040000011
其中,Srl为所述第一直播间r对所述内容标签集合中的第l个内容标签的得分,wli所述第l个内容标签下的标签关联词集合,所述wli包括词语wl1,wl2,……,wlm,wi是所述第l个内容标签下的弹幕文本词语集合,所述wi 包含词语w1,w2,……,wn,Nr(wli)为所述第一直播间r的弹幕文本中出现标签关联词wli的次数,Nr(wi)是所述第一直播间r的弹幕文本中出现弹幕文本词wi的次数,#R为所述直播平台中的直播间的总个数,#R(wl)为所述直播平台中的所有直播间中的弹幕文本中含有标签关联词集合wli中词语的直播间个数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合包括:
基于所述第一标签得分集合通过如下公式计算所述目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到所述偏好得分集合:
Figure FDA0002999514040000021
其中,wr(u)是所述目标用户u在预设时长内对所述第一直播间r的观看时长,R为所述直播平台中的全部直播间的集合,L为所述内容标签集合,l为所述内容标签集合L中的第l个内容标签;所述第一直播间r为所述直播平台中的任意一个直播间,Srl为所述直播间r对所述第l个内容标签的标签内容得分,pul为所述目标用户u对所述第l个内容标签的偏好得分。
3.根据权利要求2所述的方法,其特征在于,所述根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合包括:
基于所述偏好得分集合通过如下公式计算所述目标直播间对所述内容标签集合中的每个内容标签的标签得分,以得到所述第二标签得分集合:
Figure FDA0002999514040000031
其中,r为所述目标直播间,ur为所述直播平台中观看所述目标直播间r的用户集合,u为所述ur中的任意一个用户,cur所述u对所述目标直播间r的观看次数,pui为所述用户u对所述第i个内容标签的偏好得分,i为所述内容标签集合中的第i个内容标签,‖pui2为所述pui的L2范数,
Figure FDA0002999514040000032
sri为所述目标直播间r对所述第i个内容标签的标签得分。
4.一种确定直播间标签的装置,其特征在于,包括:
获取单元,用于获取目标直播间,所述目标直播间为直播平台中不满足预设条件的直播间;所述预设条件用于区别直播平台中新开设的直播间与老的直播间,所述新开设的直播间为不满足预设条件的直播间,所述老的直播间为满足预设条件的直播间;
所述获取单元,还用于获取所述直播平台的内容标签集合;
第一确定单元,用于确定第一直播间对所述内容标签集合中的每个内容标签的标签得分,以得到第一标签得分集合,所述第一直播间为直播平台中满足预设条件的任意一个直播间;
第一计算单元,用于根据所述第一标签得分集合计算目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到偏好得分集合,所述目标用户为观看过所述目标直播间的用户集合中的任意一个用户;
第二计算单元,用于根据所述偏好得分集合计算所述目标直播间对所述内容标签集合中每个内容标签的标签得分,以得到第二标签得分集合;
第二确定单元,用于将目标标签子集确定为所述目标直播间的标签,所述目标标签子集为所述第二标签得分集合中分数大于预设阈值的得分对应的内容标签所形成的集合,所述目标标签子集中至少包括一个内容标签;
所述第一确定单元具体用于:
通过如下公式计算所述第一直播间对所述内容标签集合中的每个内容标签的标签得分,得到所述第一标签得分集合:
Figure FDA0002999514040000041
其中,srl为所述第一直播间r对所述内容标签集合中的第l个内容标签的得分,wli所述第l个内容标签下的标签关联词集合,所述wli包括词语wl1,wl2,……,wlm,wi是所述第l个内容标签下的弹幕文本词语集合,所述wi 包含词语w1,w2,……,wn,Nr(wli)为所述第一直播间r的弹幕文本中出现标签关联词wli的次数,Nr(wi)是所述第一直播间r的弹幕文本中出现弹幕文本词wi的次数,#R为所述直播平台中的直播间的总个数,#R(wl)为所述直播平台中的所有直播间中的弹幕文本中含有标签关联词集合wli中词语的直播间个数。
5.根据权利要求4所述的装置,其特征在于,所述第一计算单元具体用于:
基于所述第一标签得分集合通过如下公式计算所述目标用户对所述内容标签集合中的每个内容标签的偏好得分,以得到所述偏好得分集合:
Figure FDA0002999514040000042
其中,wr(u)是所述目标用户u在预设时长内对所述第一直播间r的观看时长,R为所述直播平台中的全部直播间的集合,L为所述内容标签集合,l 为所述内容标签集合L中的第l个内容标签;所述第一直播间r为所述直播平台中的任意一个直播间,Srl为所述直播间r对所述第l个内容标签的标签内容得分,pul为所述目标用户u对所述第l个内容标签的偏好得分。
6.根据权利要求5所述的装置,其特征在于,所述第二计算单元具体用于:
基于所述偏好得分集合通过如下公式计算所述目标直播间对所述内容标签集合中的每个内容标签的标签得分,以得到所述第二标签得分集合:
Figure FDA0002999514040000051
其中,r为所述目标直播间,ur为所述直播平台中观看所述目标直播间r的用户集合,u为所述ur中的任意一个用户,cur所述u对所述目标直播间r的观看次数,pui为所述用户u对所述第i个内容标签的偏好得分,i为所述内容标签集合中的第i个内容标签,‖pui2为所述pui的L2范数,
Figure FDA0002999514040000052
sri为所述目标直播间r对所述第i个内容标签的标签得分。
7.一种电子设备,包括存储器、处理器,其特征在于,所述处理器用于执行存储器中存储的计算机管理类程序时实现如权利要求1至3中任意一项所述的确定直播间标签的方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机管理类程序,其特征在于:所述计算机管理类程序被处理器执行时实现如权利要求1至3中任意一项所述的确定直播间标签的方法的步骤。
CN201811137711.8A 2018-09-28 2018-09-28 一种确定直播间标签的方法以及相关设备 Active CN109361929B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811137711.8A CN109361929B (zh) 2018-09-28 2018-09-28 一种确定直播间标签的方法以及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811137711.8A CN109361929B (zh) 2018-09-28 2018-09-28 一种确定直播间标签的方法以及相关设备

Publications (2)

Publication Number Publication Date
CN109361929A CN109361929A (zh) 2019-02-19
CN109361929B true CN109361929B (zh) 2021-05-28

Family

ID=65348051

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811137711.8A Active CN109361929B (zh) 2018-09-28 2018-09-28 一种确定直播间标签的方法以及相关设备

Country Status (1)

Country Link
CN (1) CN109361929B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919213A (zh) * 2019-02-27 2019-06-21 上海六界信息技术有限公司 直播类型的确定方法、装置、设备及存储介质
CN113033680A (zh) * 2021-03-31 2021-06-25 北京有竹居网络技术有限公司 视频分类方法、装置、可读介质及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101141591A (zh) * 2007-09-29 2008-03-12 腾讯科技(深圳)有限公司 节目列表显示方法及网络视频系统
CN102799662A (zh) * 2012-07-10 2012-11-28 北京奇虎科技有限公司 推荐网址的方法、装置及系统
CN103593425A (zh) * 2013-11-08 2014-02-19 南方电网科学研究院有限责任公司 基于偏好的智能检索方法及系统
CN105022797A (zh) * 2015-06-30 2015-11-04 北京奇艺世纪科技有限公司 一种资源的主题处理方法和装置
CN106096047A (zh) * 2016-06-28 2016-11-09 武汉斗鱼网络科技有限公司 基于熵值法的用户分区偏好计算方法及系统
CN108153791A (zh) * 2016-12-02 2018-06-12 阿里巴巴集团控股有限公司 一种资源推荐方法和相关装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101141591A (zh) * 2007-09-29 2008-03-12 腾讯科技(深圳)有限公司 节目列表显示方法及网络视频系统
CN102799662A (zh) * 2012-07-10 2012-11-28 北京奇虎科技有限公司 推荐网址的方法、装置及系统
CN103593425A (zh) * 2013-11-08 2014-02-19 南方电网科学研究院有限责任公司 基于偏好的智能检索方法及系统
CN105022797A (zh) * 2015-06-30 2015-11-04 北京奇艺世纪科技有限公司 一种资源的主题处理方法和装置
CN106096047A (zh) * 2016-06-28 2016-11-09 武汉斗鱼网络科技有限公司 基于熵值法的用户分区偏好计算方法及系统
CN108153791A (zh) * 2016-12-02 2018-06-12 阿里巴巴集团控股有限公司 一种资源推荐方法和相关装置

Also Published As

Publication number Publication date
CN109361929A (zh) 2019-02-19

Similar Documents

Publication Publication Date Title
CN110896488B (zh) 一种直播间的推荐方法以及相关设备
US10575037B2 (en) Video recommending method, server, and storage media
US10417500B2 (en) System and method for automatic generation of sports media highlights
CN104081429B (zh) 基于视频同现统计数据的视频推荐
CN109218769B (zh) 一种直播间的推荐方法以及相关设备
CN105100165B (zh) 网络服务推荐方法和装置
WO2013062620A2 (en) Methods and systems for analyzing data of an online social network
CN109286850A (zh) 一种基于弹幕的视频标注方法及终端
CN110175291B (zh) 基于相似度计算的手游推荐方法、存储介质、设备及系统
CN109255371B (zh) 一种确定直播平台虚假关注用户的方法以及相关设备
CN103365936A (zh) 视频推荐系统及其方法
US20220100807A1 (en) Systems and methods for categorizing, evaluating, and displaying user input with publishing content
CN106326391A (zh) 多媒体资源推荐方法及装置
CN108021622A (zh) 一种信息确定方法、装置、电子设备及存储介质
CN109388693B (zh) 一种确定分区意图的方法以及相关设备
CN109361929B (zh) 一种确定直播间标签的方法以及相关设备
CN109257617B (zh) 一种确定直播平台中嫌疑用户的方法以及相关设备
CN110895594A (zh) 一种页面展示的方法以及相关设备
CN109120955B (zh) 一种直播间的推荐方法以及相关设备
Li Chinese television between the state and the market: An analysis of the business reality show Win in China
CN111064971B (zh) 一种自定义开播通知的方法以及相关设备
KR101976056B1 (ko) 추천 시스템 및 추천 방법
CN111128233A (zh) 录音检测方法、装置、电子设备及存储介质
KR101486924B1 (ko) 소셜 네트워크 서비스를 이용한 미디어 콘텐츠 추천 방법
JP6622319B2 (ja) 検索語リスト提供装置、及びそれを利用した方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant