CN109086813A - 主播相似度的确定方法、装置、设备及存储介质 - Google Patents

主播相似度的确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109086813A
CN109086813A CN201810811389.6A CN201810811389A CN109086813A CN 109086813 A CN109086813 A CN 109086813A CN 201810811389 A CN201810811389 A CN 201810811389A CN 109086813 A CN109086813 A CN 109086813A
Authority
CN
China
Prior art keywords
main broadcaster
overlapped
history
user
viewing user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810811389.6A
Other languages
English (en)
Other versions
CN109086813B (zh
Inventor
刘静
仇贲
张祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Information Technology Co Ltd
Original Assignee
Guangzhou Huya Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Information Technology Co Ltd filed Critical Guangzhou Huya Information Technology Co Ltd
Priority to CN201810811389.6A priority Critical patent/CN109086813B/zh
Publication of CN109086813A publication Critical patent/CN109086813A/zh
Application granted granted Critical
Publication of CN109086813B publication Critical patent/CN109086813B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/285Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例公开了一种主播相似度的确定方法、装置、设备及存储介质。所述方法包括:获取第一主播和第二主播对应的多个历史重合观看用户;根据所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的行为信息,对所述多个历史重合观看用户按照主播倾向性进行分类,所述主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好;根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定所述第一主播和所述第二主播之间的相似度。通过本发明的技术方案,能够实现对不同用户量级主播之间的相似度判断,提高对主播之间相似度判断的准确性。

Description

主播相似度的确定方法、装置、设备及存储介质
技术领域
本发明实施例涉及网络直播技术,尤其涉及一种主播相似度的确定方法、装置、设备及存储介质。
背景技术
随着网络直播逐渐盛行,主播的队伍也越来越壮大。在众多主播中,存在很多优质主播,当然也存在很多劣质主播。随着新主播的不断加入,如何及时从新主播中识别出优质主播和劣质主播,对主播进行分类,以及时发现并重点培养优质主播,是各大直播平台亟需解决的一个问题。
为了解决这个问题,首先要考虑主播之间的相似度,通过相似度对比就可以对新主播进行分类,例如,与优质主播相似度高的新主播即可确定为潜在的优质主播,从而进行重点培养。
现有技术中,两个主播之间的相似度是通过双方拥有用户量的差值大小来确定的,但是对于老主播和新主播而言,二者的用户量根本没有可比性,使得不同用户量级的主播之间无法进行比较,也就无法衡量不同用户量级的主播之间的相似度。
发明内容
本发明实施例提供一种主播相似度的确定方法、装置、设备及存储介质,以实现对不同用户量级主播之间的相似度判断,提高对主播之间相似度判断的准确性。
第一方面,本发明实施例提供了一种主播相似度的确定方法,包括:
获取第一主播和第二主播对应的多个历史重合观看用户;
根据所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的行为信息,对所述多个历史重合观看用户按照主播倾向性进行分类,所述主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好;
根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定所述第一主播和所述第二主播之间的相似度。
第二方面,本发明实施例还提供了一种主播相似度的确定装置,该装置包括:
用户获取模块,用于获取第一主播和第二主播对应的多个历史重合观看用户;
用户分类模块,用于根据所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的行为信息,对所述多个历史重合观看用户按照主播倾向性进行分类,所述主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好;
相似度确定模块,用于根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定所述第一主播和所述第二主播之间的相似度。
第三方面,本发明实施例还提供了一种计算机设备,该设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明实施例中任一所述的主播相似度的确定方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例中任一所述的主播相似度的确定方法。
本发明实施例通过获取的第一主播和第二主播对应的多个历史重合观看用户,分别针对这两个主播的行为信息,将多个历史重合观看用户按照偏好第一主播、偏好第二主播以及无偏好进行分类,再根据各类别中的用户数量确定第一主播和第二主播之间的相似度,通过将历史重合观看用户的行为作为参考对主播相似度进行判断,解决了现有技术中通过双方拥有用户量的差值大小来确定两个主播之间的相似度,而导致的不同用户量级的主播之间的相似度无法衡量的问题,实现了对不同用户量级主播之间的相似度判断,提高了对主播之间相似度判断的准确性。
附图说明
图1是本发明实施例一提供的一种主播相似度的确定方法的流程示意图;
图2a是本发明实施例二提供的一种主播相似度的确定方法的流程示意图;
图2b是本发明实施例二适用的一种历史重合观看用户评分规则的示意图;
图3是本发明实施例三提供的一种主播相似度的确定装置的结构示意图;
图4是本发明实施例四提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种主播相似度的确定方法的流程示意图。该方法可适用于对主播之间的相似度进行评估的情况,该方法可以由主播相似度的确定装置来执行,该装置可由硬件和/或软件组成,并一般可集成在计算机以及所有包含程序运行功能的智能设备中。具体包括如下:
S110、获取第一主播和第二主播对应的多个历史重合观看用户。
本实施例中历史重合观看用户可以是既观看过第一主播的用户,又观看过第二主播的用户,其中,观看过主播具体表现为进入过主播的直播间。具体的,直播间可以为由网络直播平台提供的网络直播间,主播可通过在其所使用的终端上登录主播账号建立或者进入与该主播账号关联的直播间,以进行直播,用户也可以通过在其所使用的终端上登录用户账号进入该直播间,以观看主播的直播内容。
示例性的,可记录每一个进入过主播直播间的用户账号,作为该主播的历史观看用户,分别获取第一主播以及第二主播的历史观看用户,并从两者的历史观看用户中抽取多个重合用户,也即第一主播和第二主播对应的历史重合观看用户。
其中,第一主播和第二主播可以是从网络直播平台上获取的任意两个主播,也可以是满足设定选择条件的主播;获取的多个历史重合观看用户可以是第一主播和第二主播所有的历史重合观看用户,也可以是第一主播和第二主播所有的历史重合观看用户中满足设定选择条件的用户,在此不作限定。
S120、根据多个历史重合观看用户分别针对第一主播以及第二主播的行为信息,对多个历史重合观看用户按照主播倾向性进行分类,主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好。
其中,行为信息可以是能够体现用户对主播的喜爱倾向性的行为信息,具有喜爱倾向性的行为例如可以是订阅行为、观看行为、在线送礼行为等一项或多项行为。
示例性的,可针对每个历史重合观看用户对第一主播和第二主播的具有喜爱倾向性的行为,对每个历史重合观看用户进行分类。例如,若均观看了第一主播和第二主播的用户,最后仅订阅了第一主播,说明用户喜欢第一主播的倾向性更大,因此可将该用户划分为偏好第一主播类;若仅订阅了第二主播,说明用户喜欢第二主播的倾向性更大,因此可将该用户划分为偏好第二主播类;若既订阅了第一主播又订阅了第二主播,或者既没订阅第一主播又没订阅第二主播,说明用户喜欢第一主播的倾向性和喜欢第二主播的倾向性差别不大,因此可将该用户划分为无偏好。此外,需要说明的是,凡是能根据用户的行为信息对用户按照主播倾向性进行分类的实现方式,均在本发明的保护范围之内。
对历史重合观看用户按照主播倾向性进行分类的好处在于,可以排除只观看过其中一个主播的带有过多偏好倾向性的用户数量的干扰,从同时观看过这两个主播的用户中,区分出偏好第一主播的用户、偏好第二主播的用户以及无偏好的用户,为后续步骤中通过各类别中所占用户的数量来确定主播之间的相似度提供判定基础。
S130、根据多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定第一主播和第二主播之间的相似度。
示例性的,可通过历史重合观看用户总数中,各类别的用户数量所占的比例,来确定第一主播和第二主播之间的相似度。例如,若偏好第一主播的用户数量所占比例要远大于偏好第二主播的用户数量所占比例,或者,偏好第一主播的用户数量所占比例要远小于偏好第二主播的用户数量所占比例,则可确定第一主播与第二主播之间的相似度较低;若偏好第一主播的用户数量所占比例与偏好第二主播的用户数量所占比例差别不大,则可确定第一主播与第二主播之间的相似度较高。
对于同时观看过两个主播的用户来说,会对这两个主播存在相应的感情倾向性,本实施例按照用户的感情倾向性进行分类,通过各类别中用户数量所占比例,从侧面来反映第一主播与第二主播的直播质量,为不同用户量级的主播之间进行比较提供了可行性,同时,从多个用户行为来判断主播之间的相似度更具有客观性,使得相似度判断相较于现有技术中单纯通过双方拥有用户量的差值大小来进行确定,更加准确。
可选的,根据多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定第一主播和第二主播之间的相似度,包括:根据多个历史重合观看用户属于不同主播倾向性类别的用户数量以及预设熵计算公式,计算第一主播和第二主播的熵值;按照熵值确定第一主播和第二主播之间的相似度大小。
示例性的,在对两个主播进行相似度判断的过程中,历史重合观看用户中分别偏好第一主播和偏好第二主播的用户数量越均衡,那么这两个主播的直播质量也就越相当,也即这两个主播之间的相关性越大,因此,可根据同时观看过这两个主播的用户偏好第一主播或偏好第二主播的概率,也即利用预设熵计算公式,来计算主播的熵值。
对于预设熵计算公式,本申请实施例可以采用类似于信息熵的方式计算,即熵h=-P log2P。其中,P可以为偏好第一主播的概率也可以为偏好第二主播的概率,例如在P为偏好第一主播的概率的具体计算方式中,一种可选方式是,直接用偏好第一主播的用户数量除以二者用户数量之和;另一种可选方式是,用偏好第一主播的用户数量,或者,偏好第一主播和无偏好的用户数量之和,除以历史重合观看用户的总数量。但是通过这两种方式最终计算出的熵值,由于没有将无偏好的用户数量与其他类别的用户数量结合起来,因此,可能会出现较大误差。例如,若偏好第一主播的用户数量为1,偏好第二主播的用户数量为9,则采用第一种方式确定出的相似度就会很低,但是同时,若无偏好的用户数量为490,则可知第一主播与第二主播之间的相似度应该很高才对,从而出现较大误差。若采用第二种方式误差虽然比第一种方式要小,但是也存在一定的误差。
为了尽可能消除某些情况下出现的误差,本实施例中具体可以采用如下二元信息熵公式来确定第一主播与第二主播之间的相似度:
其中,h为第一主播与第二主播之间的相似度值,like_a为多个历史重合观看用户中偏好第一主播的用户数量,like_b为多个历史重合观看用户中偏好第二主播的用户数量,same为多个历史重合观看用户中无偏好的用户数量。根据信息熵公式的特点可知,0<h≤1。
具体的,根据公式(1)计算出的相似度值h具有以下特点:第一主播与第二主播的水平差距越小,例如第一主播与第二主播同为优质主播或同为非优质主播,计算出的h值越大,也即h值越趋近于1;第一主播与第二主播的水平差距越大,计算出的h值越小,也即h值越偏离1。根据h的取值及其特点,即可确定第一主播和第二主播之间的相似度,当h值大于预设阈值,则可确定第一主播和第二主播的相似度高,从而将第一主播和第二主播归为一个类别。
利用公式(1)来计算主播之间相似度的好处在于,综合考虑了所有类别中的用户数量,相较于单纯考虑偏好第一主播和偏好第二主播这两个类别中的用户数量,而不将无偏好类别中的用户数量分别加入到偏好第一主播和偏好第二主播中,来计算概率的方法,本实施例采用的公式(1)中概率的计算方法能够兼顾到历史重合观看用户中无偏好类别的用户数量,计算出的相似度值更加准确,进而提高了相似度判断的准确性。
本实施例的技术方案,通过获取的第一主播和第二主播对应的多个历史重合观看用户,分别针对这两个主播的行为信息,将多个历史重合观看用户按照偏好第一主播、偏好第二主播以及无偏好进行分类,再根据各类别中的用户数量确定第一主播和第二主播之间的相似度,通过将历史重合观看用户的行为作为参考对主播相似度进行判断,解决了现有技术中通过双方拥有用户量的差值大小来确定两个主播之间的相似度,而导致的不同用户量级的主播之间的相似度无法衡量的问题,实现了对不同用户量级主播之间的相似度判断,提高了对主播之间相似度判断的准确性。
在上述实施例的基础上,可选的,在获取第一主播和第二主播对应的多个历史重合观看用户之前,还包括:从同一直播类型的主播中,获取满足预设直播条件的目标主播,预设直播条件包括直播天数不小于预设直播天数阈值和/或历史观看用户量不小于预设数量阈值;从目标主播中依次选取任意两个主播,作为第一主播和第二主播。
为了进一步提高相似度判断的准确性,可选取具有相同直播条件的主播作为第一主播和第二主播,具体的,可在同类型主播中针对满足预设直播条件的目标主播进行配对。举一个实际例子,在做同一款游戏直播的主播中,获取所有开播该款游戏直播的天数在6天及以上,并且每月的日均历史观看用户量不小于2000的主播,从中依次选取任意两个主播进行相似度比较。
预设直播条件中,设置直播天数不小于预设直播天数阈值的目的是,排除直播不稳定的主播,将直播稳定的主播作为待选取对象;设置历史观看用户量不小于预设数量阈值的目的是,排除过于冷门的主播,保证了主播之间进行比较时的公平性,从而进一步提高相似度判断的准确性。
在上述实施例的基础上,可选的,获取第一主播和第二主播对应的多个历史重合观看用户,包括:获取第一主播和第二主播对应的历史重合观看用户集;从历史重合观看用户集中,选取满足预设用户条件的历史重合观看用户;其中,预设用户条件包括:预设时间段内的新建用户,具有历史订阅记录,以及观看天数大于预设观看天数阈值中的至少一项。
示例性的,在对历史重合观看用户进行选取的过程中,为了进一步提高主播相似度判断的准确性,可按照预设以下原则进行用户选取:限制用户是当月新增的用户,也即预设时间段内的新建用户,这是为了防止老用户带有过多的主观倾向;选取其中有过订阅的用户,也即具有历史订阅记录的用户,这是为了排除没有订阅习惯的用户,以免干扰后续的类型判断过程;保证选取的用户为有效用户,也即观看天数大于预设观看天数阈值,例如用户在平台上的主播观看天数大于等于2,这是为了排除通过非本网络直播平台的其他渠道,进入直播间观看主播的游客(也即无效用户)的干扰。
实施例二
图2为本发明实施例二提供的一种主播相似度的确定方法的流程示意图。本实施例以上述实施例为基础进行优化,提供了优选的主播相似度的确定方法,具体是,对根据多个历史重合观看用户分别针对第一主播以及第二主播的行为信息,对多个历史重合观看用户按照主播倾向性进行分类,进行了进一步优化。具体包括如下:
S210、获取第一主播和第二主播对应的多个历史重合观看用户。
S220、获取多个历史重合观看用户分别针对第一主播以及第二主播的订阅信息和观看信息。
示例性的,对于每个历史重合观看用户,获取其针对第一主播以及第二主播的订阅信息,例如是否订阅了第一主播,以及是否订阅了第二主播,其中,订阅形式例如可以是添加关注主播。另外,还要获取其针对第一主播和第二主播的观看信息,例如单次观看第一主播的最高连续观看时长,以及单次观看第二主播的最高连续观看时长。
获取订阅信息和观看信息的目的在于,通过对同时观看过第一主播和第二主播的用户的订阅行为和观看行为进行分析,来获取该用户在第一主播和第二主播中的偏好倾向,以便于在后续步骤中对该用户进行分类。
S230、根据订阅信息和观看信息分别对多个历史重合观看用户按照主播倾向性进行分类。
本实施例中,通过订阅信息和观看信息,可获得历史重合观看用户针对第一主播和第二主播的不同倾向性,进而按照每个历史重合观看用户的主播倾向性,将历史重合观看用户分为偏好第一主播、偏好第二主播以及无偏好三类。例如,若历史重合观看用户已订阅第一主播,并且连续观看第一主播的时长大于连续观看第二主播的时长,那么该历史重合观看用户可划分至偏好第一主播类。具体的,可根据预设的类别条件对历史重合观看用户进行分类,其中,类别条件包含订阅条件和观看条件。
由于订阅行为和观看行为能够体现出用户对主播的喜好程度,因此,根据订阅信息和观看信息对多个历史重合观看用户进行分类的好处在于,可以利用同时观看过第一主播和第二主播的用户,对两个主播的感情倾向性,来反映主播的直播水平,从而实现不同用户量级主播之间的比较,也提高了后续对主播相似度判断的准确性。
可选的,根据订阅信息和观看信息分别对多个历史重合观看用户按照主播倾向性进行分类,包括:根据订阅信息,确定多个历史重合观看用户在第一主播以及第二主播中选择订阅的主播;根据观看信息,确定多个历史重合观看用户分别针对第一主播以及第二主播的连续观看时长所达到的连续观看时长等级;根据多个历史重合观看用户在第一主播以及第二主播中选择订阅的主播以及连续观看时长,对多个历史重合观看用户按照主播倾向性进行分类。
其中,针对第一主播或第二主播的连续观看时长可以是单次观看第一主播或第二主播的最高连续观看时长,也可以是最近一次观看第一主播或第二主播的连续观看时长,在此不作限定。示例性的,可根据历史重合观看用户的订阅选择以及连续观看时长生成各类别对应的类别条件,以对历史重合观看用户进行分类。
示例性的,可按照订阅信息和观看信息对每个历史重合观看用户进行量化打分,例如,采用如图2b所示的评分规则对用户进行打分,具体为,分别针对主播A的订阅行为和针对主播B的订阅行为,以及单次持续观看时长所能达到的连续观看时长等级,进行单项打分,其中,连续观看时长等级可以包括:达到5分钟、达到10分钟、达到20分钟以及达到30分钟。如图2b所示,若已订阅主播A,则a_is_dy=1,否则a_is_dy=0;若用户单次观看主播A的时长达到5分钟,则a_watch_5=1,否则a_watch_5=0;若用户单次观看主播A的时长达到10分钟,则a_watch_10=1,否则a_watch_10=0;若用户单次观看主播A的时长达到20分钟,则a_watch_20=1,否则a_watch_20=0;若用户单次观看主播A的时长达到30分钟,则a_watch_30=1,否则a_watch_30=0。历史重合观看用户针对主播B的评分规则同A,在此不再赘述。
采用如图2b所示的评分规则,一种可选实施方式为,若用户针对主播A的行为分数比针对主播B的行为分数高,则可判定用户为偏好主播A;若用户针对主播A的行为分数比针对主播B的行为分数低,则可判定用户为偏好主播B;若用户针对主播A的行为分数与针对主播B的行为分数相等,则可判定用户为无偏好。
可选的,根据多个历史重合观看用户在第一主播以及第二主播中选择订阅的主播以及连续观看时长,对多个历史重合观看用户按照主播倾向性进行分类,包括:若历史重合观看用户满足已订阅第一主播的条件,或者,在满足均已订阅或均未订阅第一主播和第二主播的条件的同时,还满足针对第一主播的连续观看时长等级高于针对第二主播的连续观看时长等级,则将历史重合观看用户确定为偏好第一主播;若历史重合观看用户满足已订阅第二主播的条件,或者,在满足均已订阅或均未订阅第一主播和第二主播的条件的同时,还满足针对第二主播的连续观看时长等级高于针对第一主播的连续观看时长等级,则将历史重合观看用户确定为偏好第二主播;若历史重合观看用户在满足均已订阅或均未订阅第一主播和第二主播的条件的同时,还满足针对第二主播的连续观看时长等级等于针对第一主播的连续观看时长等级,则将历史重合观看用户确定为无偏好。
具体的,基于图2b中的评分规则,每个类别对应的类别条件如下:
偏好主播A的类别条件为:(a_is_dy=1and b_is_dy=0)or(((a_is_dy=1and b_is_dy=1)or(a_is_dy=0and b_is_dy=0))and a_watch_5+a_watch_10+a_watch_20+a_watch_30>b_watch_5+b_watch_10+b_watch_20+b_watch_30);
偏好主播B的类别条件为:(a_is_dy=0and b_is_dy=1)or(((a_is_dy=1and b_is_dy=1)or(a_is_dy=0and b_is_dy=0))and a_watch_5+a_watch_10+a_watch_20+a_watch_30<b_watch_5+b_watch_10+b_watch_20+b_watch_30);
无偏好的类别条件为:((a_is_dy=1and b_is_dy=1)or(a_is_dy=0and b_is_dy=0))and a_watch_5+a_watch_10+a_watch_20+a_watch_30=b_watch_5+b_watch_10+b_watch_20+b_watch_30。
在上述类别条件的基础上,若历史重合观看用户满足偏好主播A的类别条件,则可确定为偏好主播A;若历史重合观看用户满足偏好主播B的类别条件,则可确定为偏好主播B;若历史重合观看用户满足无偏好的类别条件,则可确定为无偏好。例如,若用户既订阅了主播A,也订阅了主播B,但是用户观看主播A的时长为8分钟,观看主播B的时长为10分钟,由于针对主播B的连续观看时长等级(达到10分钟)高于针对主播A的连续观看时长等级(达到5分钟),则将该用户确定为偏好主播B。
S240、根据多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定第一主播和第二主播之间的相似度。
本实施例的技术方案,通过根据获取的多个历史重合观看用户分别针对第一主播和第二主播的订阅信息和观看信息,对多个历史重合观看用户按照主播倾向性进行分类,并根据各类别中的用户数量,来确定第一主播和第二主播之间的相似度,利用订阅行为和观看行为分析用户对主播的喜好程度,进而通过同时观看过这两个主播的用户的行为来反映主播的直播水平,从而实现不同用户量级主播之间的比较,也提高了对主播相似度判断的准确性。
实施例三
图3为本发明实施例三提供的一种主播相似度的确定装置的结构示意图。参考图3,主播相似度的确定装置包括:用户获取模块310、用户分类模块320以及相似度确定模块330,下面对各模块进行具体说明。
用户获取模块310,用于获取第一主播和第二主播对应的多个历史重合观看用户。
用户分类模块320,用于根据所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的行为信息,对所述多个历史重合观看用户按照主播倾向性进行分类,所述主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好。
相似度确定模块330,用于根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定所述第一主播和所述第二主播之间的相似度。
本实施例提供的主播相似度的确定装置,通过获取的第一主播和第二主播对应的多个历史重合观看用户,分别针对这两个主播的行为信息,将多个历史重合观看用户按照偏好第一主播、偏好第二主播以及无偏好进行分类,再根据各类别中的用户数量确定第一主播和第二主播之间的相似度,通过将历史重合观看用户的行为作为参考对主播相似度进行判断,解决了现有技术中通过双方拥有用户量的差值大小来确定两个主播之间的相似度,而导致的不同用户量级的主播之间的相似度无法衡量的问题,实现了对不同用户量级主播之间的相似度判断,提高了对主播之间相似度判断的准确性。
可选的,用户分类模块320,具体可以包括:信息获取子模块以及倾向性分类子模块。
其中,信息获取子模块,用于获取所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的订阅信息和观看信息。
倾向性分类子模块,用于根据所述订阅信息和观看信息分别对所述多个历史重合观看用户按照主播倾向性进行分类。
可选的,倾向性分类子模块,具体可以包括:主播确定单元、时长确定单元以及综合分类单元。
其中,主播确定单元,用于根据所述订阅信息,确定所述多个历史重合观看用户在所述第一主播以及所述第二主播中选择订阅的主播;
时长确定单元,用于根据所述观看信息,确定所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的连续观看时长所达到的连续观看时长等级;
综合分类单元,用于根据所述多个历史重合观看用户在所述第一主播以及所述第二主播中选择订阅的主播以及所述连续观看时长,对所述多个历史重合观看用户按照主播倾向性进行分类。
可选的,综合分类单元具体可以用于:若所述历史重合观看用户满足已订阅所述第一主播的条件,或者,在满足均已订阅或均未订阅所述第一主播和所述第二主播的条件的同时,还满足针对所述第一主播的连续观看时长等级高于针对所述第二主播的连续观看时长等级,则将所述历史重合观看用户确定为偏好第一主播;若所述历史重合观看用户满足已订阅所述第二主播的条件,或者,在满足均已订阅或均未订阅所述第一主播和所述第二主播的条件的同时,还满足针对所述第二主播的连续观看时长等级高于针对所述第一主播的连续观看时长等级,则将所述历史重合观看用户确定为偏好第二主播;若所述历史重合观看用户在满足均已订阅或均未订阅所述第一主播和所述第二主播的条件的同时,还满足针对所述第二主播的连续观看时长等级等于针对所述第一主播的连续观看时长等级,则将所述历史重合观看用户确定为无偏好。
可选的,相似度确定模块330具体可以用于:根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量以及预设熵计算公式,计算所述第一主播和所述第二主播的熵值;按照所述熵值确定所述第一主播和所述第二主播之间的相似度大小。
可选的,主播相似度的确定装置还可以包括:主播获取模块,用于在获取第一主播和第二主播对应的多个历史重合观看用户之前,从同一直播类型的主播中,获取满足预设直播条件的目标主播,所述预设直播条件包括直播天数不小于预设直播天数阈值和/或历史观看用户量不小于预设数量阈值;从所述目标主播中依次选取任意两个主播,作为所述第一主播和所述第二主播。
可选的,用户获取模块310具体可以用于:获取第一主播和第二主播对应的历史重合观看用户集;从所述历史重合观看用户集中,选取满足预设用户条件的历史重合观看用户;其中,所述预设用户条件包括:预设时间段内的新建用户,具有历史订阅记录,以及观看天数大于预设观看天数阈值中的至少一项。
上述产品可执行本发明任意实施例所提供的方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种计算机设备的结构示意图,如图4所示,本实施例提供的一种计算机设备,包括:处理器41和存储器42。该计算机设备中的处理器可以是一个或多个,图4中以一个处理器41为例,所述计算机设备中的处理器41和存储器42可以通过总线或其他方式连接,图4中以通过总线连接为例。
本实施例中计算机设备的处理器41中集成了上述实施例提供的主播相似度的确定装置。此外,该计算机设备中的存储器42作为一种计算机可读存储介质,可用于存储一个或多个程序,所述程序可以是软件程序、计算机可执行程序以及模块,如本发明实施例中主播相似度的确定方法对应的程序指令/模块(例如,附图3所示的主播相似度的确定装置中的模块,包括:用户获取模块310、用户分类模块320以及相似度确定模块330)。处理器41通过运行存储在存储器42中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述方法实施例中主播相似度的确定方法。
存储器42可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器42可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器42可进一步包括相对于处理器41远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
并且,当上述计算机设备所包括一个或者多个程序被所述一个或者多个处理器41执行时,程序进行如下操作:
获取第一主播和第二主播对应的多个历史重合观看用户;根据多个历史重合观看用户分别针对第一主播以及第二主播的行为信息,对多个历史重合观看用户按照主播倾向性进行分类,主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好;根据多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定第一主播和第二主播之间的相似度。
实施例五
本发明实施例五还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被主播相似度的确定装置执行时实现如本发明实施例一提供的主播相似度的确定方法,该方法包括:获取第一主播和第二主播对应的多个历史重合观看用户;根据多个历史重合观看用户分别针对第一主播以及第二主播的行为信息,对多个历史重合观看用户按照主播倾向性进行分类,主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好;根据多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定第一主播和第二主播之间的相似度。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序被执行时不限于实现如上的方法操作,还可以实现本发明任意实施例所提供的主播相似度的确定方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
值得注意的是,上述主播相似度的确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种主播相似度的确定方法,其特征在于,包括:
获取第一主播和第二主播对应的多个历史重合观看用户;
根据所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的行为信息,对所述多个历史重合观看用户按照主播倾向性进行分类,所述主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好;
根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定所述第一主播和所述第二主播之间的相似度。
2.根据权利要求1所述的方法,其特征在于,根据所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的行为信息,对所述多个历史重合观看用户按照主播倾向性进行分类,包括:
获取所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的订阅信息和观看信息;
根据所述订阅信息和观看信息分别对所述多个历史重合观看用户按照主播倾向性进行分类。
3.根据权利要求2所述的方法,其特征在于,根据所述订阅信息和观看信息分别对所述多个历史重合观看用户按照主播倾向性进行分类,包括:
根据所述订阅信息,确定所述多个历史重合观看用户在所述第一主播以及所述第二主播中选择订阅的主播;
根据所述观看信息,确定所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的连续观看时长所达到的连续观看时长等级;
根据所述多个历史重合观看用户在所述第一主播以及所述第二主播中选择订阅的主播以及所述连续观看时长,对所述多个历史重合观看用户按照主播倾向性进行分类。
4.根据权利要求3所述的方法,其特征在于,根据所述多个历史重合观看用户在所述第一主播以及所述第二主播中选择订阅的主播以及所述连续观看时长,对所述多个历史重合观看用户按照主播倾向性进行分类,包括:
若所述历史重合观看用户满足已订阅所述第一主播的条件,或者,在满足均已订阅或均未订阅所述第一主播和所述第二主播的条件的同时,还满足针对所述第一主播的连续观看时长等级高于针对所述第二主播的连续观看时长等级,则将所述历史重合观看用户确定为偏好第一主播;
若所述历史重合观看用户满足已订阅所述第二主播的条件,或者,在满足均已订阅或均未订阅所述第一主播和所述第二主播的条件的同时,还满足针对所述第二主播的连续观看时长等级高于针对所述第一主播的连续观看时长等级,则将所述历史重合观看用户确定为偏好第二主播;
若所述历史重合观看用户在满足均已订阅或均未订阅所述第一主播和所述第二主播的条件的同时,还满足针对所述第二主播的连续观看时长等级等于针对所述第一主播的连续观看时长等级,则将所述历史重合观看用户确定为无偏好。
5.根据权利要求1所述的方法,其特征在于,根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定所述第一主播和所述第二主播之间的相似度,包括:
根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量以及预设熵计算公式,计算所述第一主播和所述第二主播的熵值;
按照所述熵值确定所述第一主播和所述第二主播之间的相似度大小。
6.根据权利要求1-5任一项所述的方法,其特征在于,在获取第一主播和第二主播对应的多个历史重合观看用户之前,还包括:
从同一直播类型的主播中,获取满足预设直播条件的目标主播,所述预设直播条件包括直播天数不小于预设直播天数阈值和/或历史观看用户量不小于预设数量阈值;
从所述目标主播中依次选取任意两个主播,作为所述第一主播和所述第二主播。
7.根据权利要求1-5任一项所述的方法,其特征在于,获取第一主播和第二主播对应的多个历史重合观看用户,包括:
获取第一主播和第二主播对应的历史重合观看用户集;
从所述历史重合观看用户集中,选取满足预设用户条件的历史重合观看用户;
其中,所述预设用户条件包括:预设时间段内的新建用户,具有历史订阅记录,以及观看天数大于预设观看天数阈值中的至少一项。
8.一种主播相似度的确定装置,其特征在于,包括:
用户获取模块,用于获取第一主播和第二主播对应的多个历史重合观看用户;
用户分类模块,用于根据所述多个历史重合观看用户分别针对所述第一主播以及所述第二主播的行为信息,对所述多个历史重合观看用户按照主播倾向性进行分类,所述主播倾向性的类别包括:偏好第一主播、偏好第二主播以及无偏好;
相似度确定模块,用于根据所述多个历史重合观看用户属于不同主播倾向性类别的用户数量,确定所述第一主播和所述第二主播之间的相似度。
9.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的主播相似度的确定方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的主播相似度的确定方法。
CN201810811389.6A 2018-07-23 2018-07-23 主播相似度的确定方法、装置、设备及存储介质 Active CN109086813B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810811389.6A CN109086813B (zh) 2018-07-23 2018-07-23 主播相似度的确定方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810811389.6A CN109086813B (zh) 2018-07-23 2018-07-23 主播相似度的确定方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109086813A true CN109086813A (zh) 2018-12-25
CN109086813B CN109086813B (zh) 2021-05-14

Family

ID=64838078

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810811389.6A Active CN109086813B (zh) 2018-07-23 2018-07-23 主播相似度的确定方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109086813B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111488491A (zh) * 2020-06-24 2020-08-04 武汉斗鱼鱼乐网络科技有限公司 一种识别目标主播的方法及系统、介质、设备
CN111586427A (zh) * 2020-04-30 2020-08-25 广州华多网络科技有限公司 直播平台的主播识别方法、装置、电子设备及存储介质
CN113971038A (zh) * 2020-07-22 2022-01-25 北京达佳互联信息技术有限公司 应用程序账户的异常识别方法、装置、服务器及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090077132A1 (en) * 2005-09-28 2009-03-19 Sony Corporation Information Processing Device and Method, and Program
CN104954821A (zh) * 2015-06-24 2015-09-30 北京酷云互动科技有限公司 一种节目关联度的计算方法及其计算系统
CN107613395A (zh) * 2017-08-28 2018-01-19 武汉斗鱼网络科技有限公司 直播房间推荐方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090077132A1 (en) * 2005-09-28 2009-03-19 Sony Corporation Information Processing Device and Method, and Program
CN104954821A (zh) * 2015-06-24 2015-09-30 北京酷云互动科技有限公司 一种节目关联度的计算方法及其计算系统
CN107613395A (zh) * 2017-08-28 2018-01-19 武汉斗鱼网络科技有限公司 直播房间推荐方法及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111586427A (zh) * 2020-04-30 2020-08-25 广州华多网络科技有限公司 直播平台的主播识别方法、装置、电子设备及存储介质
CN111586427B (zh) * 2020-04-30 2022-04-12 广州方硅信息技术有限公司 直播平台的主播识别方法、装置、电子设备及存储介质
CN111488491A (zh) * 2020-06-24 2020-08-04 武汉斗鱼鱼乐网络科技有限公司 一种识别目标主播的方法及系统、介质、设备
CN111488491B (zh) * 2020-06-24 2020-10-16 武汉斗鱼鱼乐网络科技有限公司 一种识别目标主播的方法及系统、介质、设备
CN113971038A (zh) * 2020-07-22 2022-01-25 北京达佳互联信息技术有限公司 应用程序账户的异常识别方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
CN109086813B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN112424763B (zh) 对象推荐方法及装置、存储介质与终端设备
CN108322829B (zh) 个性化主播推荐方法、装置及电子设备
Li et al. On social event organization
WO2020048084A1 (zh) 资源推荐方法、装置、计算机设备及计算机可读存储介质
CN108900923A (zh) 推荐直播模板的方法和装置
CN109934704A (zh) 信息推荐方法、装置、设备和存储介质
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
CN106294831B (zh) 一种信息推荐方法及电子设备
CN109408639A (zh) 一种弹幕分类方法、装置、设备和存储介质
CN108595492A (zh) 内容的推送方法和装置、存储介质、电子装置
CN109922357A (zh) 视频推荐的方法及装置
CN109086822A (zh) 一种主播用户分类方法、装置、设备及存储介质
CN109492152A (zh) 推送定制内容的方法、装置、计算机设备及存储介质
CN109245989A (zh) 一种基于信息分享的处理方法、装置及计算机可读存储介质
CN109086813A (zh) 主播相似度的确定方法、装置、设备及存储介质
CN107273472B (zh) 一种资源受限约束下的活动推荐方法及系统
CN110427358B (zh) 数据清洗方法及装置和信息推荐方法及装置
CN113051413A (zh) 一种多媒体信息处理方法、装置、电子设备及存储介质
Ameri et al. Word-of-mouth, observational learning, and product adoption: Evidence from an anime platform
CN109684546A (zh) 推荐方法、装置、存储介质及终端
CN110147481B (zh) 媒体内容推送方法、装置及存储介质
CN110427620B (zh) 基于社群系统的服务质量优化管理系统
CN110472071A (zh) 多媒体文件推荐方法、装置、网络设备及存储介质
US20090083169A1 (en) Financial opportunity information obtainment and evaluation
WO2023179162A1 (zh) 数据处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant