CN108419135A - 相似度确定方法、装置及电子设备 - Google Patents

相似度确定方法、装置及电子设备 Download PDF

Info

Publication number
CN108419135A
CN108419135A CN201810241602.4A CN201810241602A CN108419135A CN 108419135 A CN108419135 A CN 108419135A CN 201810241602 A CN201810241602 A CN 201810241602A CN 108419135 A CN108419135 A CN 108419135A
Authority
CN
China
Prior art keywords
direct broadcasting
weight coefficient
ranking
similarity
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810241602.4A
Other languages
English (en)
Other versions
CN108419135B (zh
Inventor
王璐
陈少杰
张文明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Douyu Network Technology Co Ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201810241602.4A priority Critical patent/CN108419135B/zh
Publication of CN108419135A publication Critical patent/CN108419135A/zh
Application granted granted Critical
Publication of CN108419135B publication Critical patent/CN108419135B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供的相似度确定方法、装置及电子设备,涉及相似度确定技术领域。其中,相似度确定方法包括:分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户;针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数;根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。通过上述方法,可以改善现有技术中存在的计算得到的相似度可靠性较低的问题。

Description

相似度确定方法、装置及电子设备
技术领域
本发明涉及相似度确定技术领域,具体而言,涉及一种相似度确定方法、装置及电子设备。
背景技术
在大数据的应用中,一个重要的方向是根据大量的用户数据对用户进行个性化的推荐。其中,在直播领域中该技术得到了较大的发展。例如,可以通过计算两个直播间的相似度,并在相似度满足一定条件时,将对应的直播间推荐给用户。
经发明人研究发现,在现有的计算直播间的相似度的方法中存在着计算得到的相似度可靠性较低的问题。
发明内容
有鉴于此,本发明的目的在于提供一种相似度确定方法、装置及电子设备,以改善现有技术中存在的计算得到的相似度可靠性较低的问题。
为实现上述目的,本发明实施例采用如下技术方案:
一种相似度确定方法,用于计算两个直播间之间的相似度,分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户;
针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数,其中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种;
根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
在本发明实施例较佳的选择中,在上述相似度确定方法中,在执行根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度的步骤之前,所述方法还包括:
分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数;
所述根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度的步骤包括:
根据所述第一用户数量、第二用户数量、第一权重系数、第二权重系数和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
在本发明实施例较佳的选择中,在上述相似度确定方法中,所述预设规则为:
其中,S为两个直播间之间的相似度,f1和α分别为一个直播间对应的第一用户数量和第一权重系数,f2和β分别为另一个直播间对应的第二用户数量和第二权重系数,Iu和Wu分别为一个目标用户对应的共现次数和直播间数量。
在本发明实施例较佳的选择中,在上述相似度确定方法中,所述分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数的步骤包括:
分别获取所述两个直播间当前时刻在热门排行榜上的排位名次;
根据所述排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,排位名次较高的直播间具有较高的权重系数。
在本发明实施例较佳的选择中,在上述相似度确定方法中,所述分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数的步骤包括:
针对所述两个直播间中的每一个直播间,根据该直播间在所述预设时长内各个时刻在热门排行榜上的排位名次计算得到该直播间的总排位名次;
根据所述总排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,总排位名次较高的直播间具有较高的权重系数。
本发明实施例还提供了一种相似度确定装置,用于计算两个直播间之间的相似度,所述装置包括:
第一统计模块,用于分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户;
第二统计模块,用于针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数,其中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种;
相似度计算模块,用于根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
在本发明实施例较佳的选择中,在上述相似度确定装置中,还包括:
权重系数获取模块,用于分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数;
所述相似度计算模块包括:
相似度计算子模块,用于根据所述第一用户数量、第二用户数量、第一权重系数、第二权重系数和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
在本发明实施例较佳的选择中,在上述相似度确定装置中,所述权重系数获取模块包括:
第一排位名次获取子模块,用于分别获取所述两个直播间当前时刻在热门排行榜上的排位名次;
第一权重系数计算子模块,用于根据所述排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,排位名次较高的直播间具有较高的权重系数。
本发明实施例还提供了一种计算机可读储存介质,其上存储有计算机程序,该程序被处理器执行时实现所述相似度确定方法的步骤。
本发明实施例还提供了一种电子设备,用于计算两个直播间之间的相似度,所述电子设备包括存储器、处理器和相似度确定装置,所述相似度确定装置包括一个或多个存储于所述存储器中并由所述处理器执行的软件功能模块,其中,所述软件功能模块包括:
第一统计模块,用于分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户;
第二统计模块,用于针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数,其中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种;
相似度计算模块,用于根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
本发明提供的相似度确定方法、装置及电子设备,通过在计算相似度时将共现次数作为参考因素,并且共现次数的对象行为可以包括观看、发送弹幕和赠送礼物,可以提高保证计算得到的相似度可以更为全面的反应两个直播间之间的相似程度,从而改善现有技术中存在的计算得到的相似度可靠性较低的问题,极大地提高了相似度确定的可靠性。
进一步地,通过设置权重系数,并且权重系数通过对应直播间在热门排行榜上的排位名次确定,以避免排位名次过高而影响相似度的计算的问题,可以进一步地提高计算得到的相似度的可靠性。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本发明实施例提供的电子设备的结构框图。
图2为本发明实施例提供的相似度确定方法的流程示意图。
图3为本发明实施例提供的相似度确定方法的另一流程示意图。
图4为图3中步骤S140的流程示意图。
图5为图3中步骤S140的另一流程示意图。
图6为本发明实施例提供的相似度确定装置的结构框图。
图7为本发明实施例提供的相似度确定装置的另一结构框图。
图8为本发明实施例提供的权重系数获取模块的结构框图。
图9为本发明实施例提供的权重系数获取模块的另一结构框图。
图标:10-电子设备;12-存储器;14-处理器;100-相似度确定装置;110-第一统计模块;130-第二统计模块;140-权重系数获取模块;141-第一排位名次获取子模块;143-第一权重系数计算子模块;145-第二排位名次获取子模块;147-第二权重系数计算子模块;150-相似度计算模块;151-相似度计算子模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为只是或暗示相对重要性。
如图1所示,本发明实施例提供了一种电子设备10,用于计算两个直播间之间的相似度。其中,所述电子设备10可以包括存储器12、处理器14和相似度确定装置100。
所述存储器12和处理器14之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述直播推荐信息处理装置100包括至少一个可以软件或固件(firmware)的形式存储于所述存储器12中的软件功能模块。所述处理器14用于执行所述存储器12中存储的可执行的计算机程序,例如,所述相似度确定装置100所包括的软件功能模块及计算机程序等,以实现相似度确定方法。
其中,所述存储器12可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器12用于存储程序,所述处理器14在接收到执行指令后,执行所述程序。
所述处理器14可能是一种集成电路芯片,具有信号的处理能力。上述的处理器14可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
可以理解,图1所示的结构仅为示意,所述电子设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
可选地,所述电子设备10的具体类型不受限制,例如,可以是,但不限于,智能手机、个人电脑(personal computer,PC)、平板电脑、个人数字助理(personal digitalassistant,PDA)、移动上网设备(mobile Internet device,MID)、web(网站)服务器、数据服务器、电脑、移动上网设备(mobile Internet device,MID)等具有处理功能的设备。
结合图2,本发明实施例还提供一种可应用于上述电子设备10的相似度确定方法,用于计算两个直播间之间的相似度。其中,所述方法有关的流程所定义的方法步骤可以由所述处理器14实现。下面将对图2所示的具体流程进行详细阐述。
步骤S110,分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户。
在本实施例中,若用户在观看第一直播间,此时,需要考虑是否向用户推荐第二直播间时,可以计算第二直播间与第一直播间之间的相似度以确定是否推荐,例如,在计算得到的相似度大于预设相似度时,可以将第二直播间推荐给用户。
因此,在本实施例中,可以分别获取第一直播间在预设时长内的用户数量,以得到第一用户数量,获取第二直播间在预设时长内的用户数量,以得到第二用户数量。并且,由于相似度确定需要考虑用户对两个直播间的一些相同行为,可以通过将在预设时长内对第一直播间和第二直播间都有观看行为的用户作为目标用户。
可选地,所述预设时长的具体大小不受限制,可以根据实际应用需求进行设置,例如,可以包括,但不限于5天、7天、10天、20天或30天等。
可选地,得到的第一用户数量和第二用户数量,既可以是在预设时长内观看过第一直播间的所有用户的数量和观看过第二直播间的所有用户的数量,也可以是在预设时长内各个时刻中同时观看第一直播间的用户数量中的最大值和同时观看第二直播间的用户数量中的最大值,在本实施例中,不做具体限定,根据实际应用需求进行选择即可。
步骤S130,针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数。
在本实施例中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种。例如,目标用户为A,若A在第一直播间有观看行为,在第二直播间也有观看行为,并且,在两个直播间的观看行为之间的时间间隔小于预设间隔,则可以判定出现一次共现情形。又例如,若A在第一直播间有观看行为、发送弹幕行为和赠送礼物行为,在预设间隔内又在第二直播间有观看行为和发送弹幕行为,则可以判定出现有两次共现情形(观看行为共现和发送弹幕行为共现)。
其中,所述预设间隔的具体大小不受限制,只要小于所述预设时长即可,例如,可以包括,但不限于1小时、3小时、5小时、一天或两天等。
步骤S150,根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
在本实施例中,通过综合考虑第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数,可以保证计算得到的相似度可以更为全面的反应两个直播间之间的相似程度,从而改善现有技术中存在的计算得到的相似度可靠性较低的问题,进而提高了相似度确定的可靠性。
其中,通过预设规则计算相似度可以通过以下公式完成:
其中,S为两个直播间之间的相似度,f1为一个直播间对应的第一用户数量,f2为另一个直播间对应的第二用户数量,Iu和Wu分别为一个目标用户对应的共现次数和直播间数量。
为进一步地提高计算得到的相似度的可靠性,在本实施例中,结合图3,在执行步骤S150之前,所述相似度确定方法还可以包括步骤S140,步骤S150可以包括步骤S151。
步骤S140,分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数。
步骤S151,根据所述第一用户数量、第二用户数量、第一权重系数、第二权重系数和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
在本实施例中,可以通过分别对第一直播间和第二直播间赋值第一权重参数和第二权重参数,并在计算相似度时应用,可以根据实际应用中的具体需求以提高第一直播间和第二直播间之间的相似度的计算可靠性。
其中,通过结合第一权重系数和第二权重系数计算相似度可以通过以下公式完成:
其中,S为两个直播间之间的相似度,f1和α分别为一个直播间对应的第一用户数量和第一权重系数,f2和β分别为另一个直播间对应的第二用户数量和第二权重系数,Iu和Wu分别为一个目标用户对应的共现次数和直播间数量。
可选地,所述第一权重系数和所述第二权重系数既可以是根据经验预先设置的一固定值,例如,第一权重系数和第二权重系数都为0.5,也可以是根据实际应用实时计算得到。在本实施例中,为避免热门排行榜对计算得到的相似度的影响,所述第一权重系数和第二权重系数可以分别根据第一直播间和第二直播间的排位名次确定。
并且,用于确定第一权重系数和第二权重系数的排位名次既可以是计算时的当前时刻的排位名次,也可以是预设时长内各个时刻的总排位名次。
结合图4,在一种实例中,步骤S140可以包括步骤S141和步骤S143,以确定第一权重系数和第二权重系数。
步骤S141,分别获取所述两个直播间当前时刻在热门排行榜上的排位名次。
步骤S143,根据所述排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数。
在本实施例中,在所述预设时长内按照时间先后顺序可以包括X时刻、Y时刻以及Z时刻,其中,Z时刻为当前时刻。因此,可以分别获取在Z时刻第一直播间在热门排行榜上的第一排位名次、第二直播间在热门排行榜上的第二排位名次,并根据第一排位名次和第二排位名次的高低以确定第一直播间和第二直播间的权重系数。
其中,为避免排位名次影响相似度确定的可靠性,可以对排位名次较高的直播间进行抑制,也就是说,可以设置如下规则:排位名次较高的直播间具有较高的权重系数。例如,在第一直播间的排位名次高于第二直播间的排位名次时,第一权重系数可以大于第二权重系数,可以将第一权重系数赋值为0.6,第二权重系数赋值为0.4。
结合图5,在另一种实例中,步骤S140可以包括步骤S145和步骤S147,以确定第一权重系数和第二权重系数。
步骤S145,针对所述两个直播间中的每一个直播间,根据该直播间在所述预设时长内各个时刻在热门排行榜上的排位名次计算得到该直播间的总排位名次。
步骤S147,根据所述总排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数。
在本实施例中,在所述预设时长内按照时间先后顺序可以包括X时刻、Y时刻以及Z时刻,其中,Z时刻为当前时刻。因此,可以获取第一直播间在三个时刻的排位名次(1、9、2),并获取第二直播间在三个时刻的排位名次(3、3、3),可以计算得到第一直播间在预设时长内的总排位名次为12,第二直播间在预设时长内的总排位名次为9。通过上述计算,可以得到第一直播间在当前时刻的排位名次高于第二直播间在当前时刻的排位名次(2〈3),但是,第一直播间在预设时长内的总排位名次低于第二直播间在预设时长内的总排位名次(12〉9)。
相应地,为避免排位名次影响相似度确定的可靠性,可以对排位名次较高的直播间进行抑制,也就是说,可以设置如下规则:总排位名次较高的直播间具有较高的权重系数。例如,在上述实例中,可以将第一直播间对应的第一权重系数赋值为0.4,第二直播间对应的第二权重系数赋值为0.6。
通过对比上述两种实例,可以得知,在部分情形下通过不同的规则,可以得到不同的结果,具体采用的规则可以根据实际应用需求进行设置,只要能够全面、有效地抑制排位名次较高的直播间即可。例如,若在排行榜上的排位名次相近的直播间的用户数量相差较大时,可以通过采用总排位名次的高低以确定权重系数的规则。
结合图6,本发明实施例还提供一种可应用于上述电子设备10的相似度确定装置100,用于计算两个直播间之间的相似度。其中,所述相似度确定装置100包括第一统计模块110、第二统计模块130以及相似度计算模块150。
所述第一统计模块110,用于分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户。在本实施例中,所述第一统计模块110可用于执行图2所示的步骤S110,关于所述第一统计模块110的具体描述可以参照前文对步骤S110的描述。
所述第二统计模块130,用于针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数,其中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种。在本实施例中,所述第二统计模块130可用于执行图2所示的步骤S130,关于所述第二统计模块130的具体描述可以参照前文对步骤S130的描述。
所述相似度计算模块150,用于根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。在本实施例中,所述相似度计算模块150可用于执行图2所示的步骤S150,关于所述相似度计算模块150的具体描述可以参照前文对步骤S150的描述。
结合图7,在本实施例中,所述相似度确定装置100还可以包括权重系数获取模块140,所述相似度计算模块150可以包括相似度计算子模块151。
所述权重系数获取模块140,用于分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数。在本实施例中,所述权重系数获取模块140可用于执行图3所示的步骤S140,关于所述权重系数获取模块140的具体描述可以参照前文对步骤S140的描述。
所述相似度计算子模块151,用于根据所述第一用户数量、第二用户数量、第一权重系数、第二权重系数和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。在本实施例中,所述相似度计算子模块151可用于执行图3所示的步骤S151,关于所述相似度计算子模块151的具体描述可以参照前文对步骤S151的描述。
结合图8,在一种实例中,所述权重系数获取模块140可以包括第一排位名次获取子模块141和第一权重系数计算子模块143。
所述第一排位名次获取子模块141,用于分别获取所述两个直播间当前时刻在热门排行榜上的排位名次。在本实施例中,所述第一排位名次获取子模块141可用于执行图4所示的步骤S141,关于所述第一排位名次获取子模块141的具体描述可以参照前文对步骤S141的描述。
所述第一权重系数计算子模块143,用于根据所述排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,排位名次较高的直播间具有较高的权重系数。在本实施例中,所述第一权重系数计算子模块143可用于执行图4所示的步骤S143,关于所述第一权重系数计算子模块143的具体描述可以参照前文对步骤S143的描述。
结合图9,在另一种实例中,所述权重系数获取模块140可以包括第二排位名次获取子模块145和第二权重系数计算子模块147。
所述第二排位名次获取子模块145,用于针对所述两个直播间中的每一个直播间,根据该直播间在所述预设时长内各个时刻在热门排行榜上的排位名次计算得到该直播间的总排位名次。在本实施例中,所述第二排位名次获取子模块145可用于执行图5所示的步骤S145,关于所述第二排位名次获取子模块145的具体描述可以参照前文对步骤S145的描述。
所述第二权重系数计算子模块147,用于根据所述总排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,总排位名次较高的直播间具有较高的权重系数。在本实施例中,所述第二权重系数计算子模块147可用于执行图5所示的步骤S147,关于所述第二权重系数计算子模块147的具体描述可以参照前文对步骤S147的描述。
本发明实施例还提供一种计算机可读储存介质,其上存储有计算机程序,该程序被处理器14执行时实现所述相似度确定方法的步骤。
综上所述,本发明提供的相似度确定方法、装置及电子设备10,通过在计算相似度时将共现次数作为参考因素,并且共现次数的对象行为可以包括观看、发送弹幕和赠送礼物,可以提高保证计算得到的相似度可以更为全面的反应两个直播间之间的相似程度,从而改善现有技术中存在的计算得到的相似度可靠性较低的问题,极大地提高了相似度确定的可靠性。其次,通过设置权重系数,并且权重系数通过对应直播间在热门排行榜上的排位名次确定,以避免排位名次过高而影响相似度的计算的问题,可以进一步地提高计算得到的相似度的可靠性。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种相似度确定方法,用于计算两个直播间之间的相似度,其特征在于,所述方法包括:
分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户;
针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数,其中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种;
根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
2.根据权利要求1所述的相似度确定方法,其特征在于,在执行根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度的步骤之前,所述方法还包括:
分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数;
所述根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度的步骤包括:
根据所述第一用户数量、第二用户数量、第一权重系数、第二权重系数和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
3.根据权利要求2所述的相似度确定方法,其特征在于,所述预设规则为:
其中,S为两个直播间之间的相似度,f1和α分别为一个直播间对应的第一用户数量和第一权重系数,f2和β分别为另一个直播间对应的第二用户数量和第二权重系数,Iu和Wu分别为一个目标用户对应的共现次数和直播间数量。
4.根据权利要求2或3所述的相似度确定方法,其特征在于,所述分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数的步骤包括:
分别获取所述两个直播间当前时刻在热门排行榜上的排位名次;
根据所述排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,排位名次较高的直播间具有较高的权重系数。
5.根据权利要求2或3所述的相似度确定方法,其特征在于,所述分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数的步骤包括:
针对所述两个直播间中的每一个直播间,根据该直播间在所述预设时长内各个时刻在热门排行榜上的排位名次计算得到该直播间的总排位名次;
根据所述总排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,总排位名次较高的直播间具有较高的权重系数。
6.一种相似度确定装置,用于计算两个直播间之间的相似度,其特征在于,所述装置包括:
第一统计模块,用于分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户;
第二统计模块,用于针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数,其中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种;
相似度计算模块,用于根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
7.根据权利要求6所述的相似度确定装置,其特征在于,还包括:
权重系数获取模块,用于分别获取所述两个直播间的权重系数,以得到第一权重系数和第二权重系数;
所述相似度计算模块包括:
相似度计算子模块,用于根据所述第一用户数量、第二用户数量、第一权重系数、第二权重系数和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
8.根据权利要求7所述的相似度确定装置,其特征在于,所述权重系数获取模块包括:
第一排位名次获取子模块,用于分别获取所述两个直播间当前时刻在热门排行榜上的排位名次;
第一权重系数计算子模块,用于根据所述排位名次确定所述两个直播间的权重系数,以得到第一权重系数和第二权重系数,其中,排位名次较高的直播间具有较高的权重系数。
9.一种计算机可读储存介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任意一项所述方法的步骤。
10.一种电子设备,用于计算两个直播间之间的相似度,其特征在于,所述电子设备包括存储器、处理器和相似度确定装置,所述相似度确定装置包括一个或多个存储于所述存储器中并由所述处理器执行的软件功能模块,其中,所述软件功能模块包括:
第一统计模块,用于分别获取在预设时长内观看两个直播间的用户的数量,以得到第一用户数量和第二用户数量,并统计在所述预设时长内有观看过所述两个直播间的用户,以得到至少一个目标用户;
第二统计模块,用于针对每一个目标用户,获取该目标用户在预设时长内观看的直播间的数量以得到直播间数量,并获取该目标用户在所述两个直播间出现共现情形的次数以得到共现次数,其中,所述共现情形为目标用户在所述两个直播间具有相同的行为,所述行为包括观看、发送弹幕和赠送礼物中的至少一种;
相似度计算模块,用于根据所述第一用户数量、第二用户数量和每个目标用户对应的直播间数量和共现次数按照预设规则计算得到所述两个直播间之间的相似度。
CN201810241602.4A 2018-03-22 2018-03-22 相似度确定方法、装置及电子设备 Active CN108419135B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810241602.4A CN108419135B (zh) 2018-03-22 2018-03-22 相似度确定方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810241602.4A CN108419135B (zh) 2018-03-22 2018-03-22 相似度确定方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN108419135A true CN108419135A (zh) 2018-08-17
CN108419135B CN108419135B (zh) 2020-07-10

Family

ID=63132187

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810241602.4A Active CN108419135B (zh) 2018-03-22 2018-03-22 相似度确定方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN108419135B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989893A (zh) * 2018-08-21 2018-12-11 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、终端和存储介质
CN109257648A (zh) * 2018-09-30 2019-01-22 武汉斗鱼网络科技有限公司 一种直播间相似度修正方法、装置、终端及存储介质
CN109379608A (zh) * 2018-09-13 2019-02-22 武汉斗鱼网络科技有限公司 一种直播间的推荐方法以及相关设备
CN111083503A (zh) * 2018-10-22 2020-04-28 武汉斗鱼网络科技有限公司 对直播间计算相似度的方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120124604A1 (en) * 2010-11-12 2012-05-17 Microsoft Corporation Automatic passive and anonymous feedback system
CN102750336A (zh) * 2012-06-04 2012-10-24 电子科技大学 一种基于用户关联性的资源个性化推荐方法
US20150229980A1 (en) * 2014-02-11 2015-08-13 Disney Enterprises, Inc. Method and system for detecting commercial breaks
CN104954821A (zh) * 2015-06-24 2015-09-30 北京酷云互动科技有限公司 一种节目关联度的计算方法及其计算系统
CN105872837A (zh) * 2016-04-21 2016-08-17 广州酷狗计算机科技有限公司 用户推荐方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120124604A1 (en) * 2010-11-12 2012-05-17 Microsoft Corporation Automatic passive and anonymous feedback system
CN102750336A (zh) * 2012-06-04 2012-10-24 电子科技大学 一种基于用户关联性的资源个性化推荐方法
US20150229980A1 (en) * 2014-02-11 2015-08-13 Disney Enterprises, Inc. Method and system for detecting commercial breaks
CN104954821A (zh) * 2015-06-24 2015-09-30 北京酷云互动科技有限公司 一种节目关联度的计算方法及其计算系统
CN105872837A (zh) * 2016-04-21 2016-08-17 广州酷狗计算机科技有限公司 用户推荐方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108989893A (zh) * 2018-08-21 2018-12-11 武汉斗鱼网络科技有限公司 一种直播间推荐方法、装置、终端和存储介质
CN109379608A (zh) * 2018-09-13 2019-02-22 武汉斗鱼网络科技有限公司 一种直播间的推荐方法以及相关设备
CN109379608B (zh) * 2018-09-13 2021-07-23 武汉斗鱼网络科技有限公司 一种直播间的推荐方法以及相关设备
CN109257648A (zh) * 2018-09-30 2019-01-22 武汉斗鱼网络科技有限公司 一种直播间相似度修正方法、装置、终端及存储介质
CN109257648B (zh) * 2018-09-30 2021-03-16 武汉斗鱼网络科技有限公司 一种直播间相似度修正方法、装置、终端及存储介质
CN111083503A (zh) * 2018-10-22 2020-04-28 武汉斗鱼网络科技有限公司 对直播间计算相似度的方法、装置、设备和存储介质
CN111083503B (zh) * 2018-10-22 2022-02-22 武汉斗鱼网络科技有限公司 对直播间计算相似度的方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN108419135B (zh) 2020-07-10

Similar Documents

Publication Publication Date Title
CN108419135A (zh) 相似度确定方法、装置及电子设备
CN110941740B (zh) 视频推荐方法及计算机可读存储介质
CN104053023B (zh) 一种确定视频相似度的方法及装置
CN108174296A (zh) 恶意用户识别方法及装置
CN106294775A (zh) 内容推送方法及装置
CN108090208A (zh) 融合数据处理方法及装置
CN109543132A (zh) 内容推荐方法、装置、电子设备及存储介质
CN108363730B (zh) 一种内容推荐方法、系统及终端设备
CN108390883A (zh) 刷人气用户的识别方法、装置及终端设备
CN108366012A (zh) 一种社交关系建立方法、装置及电子设备
CN104424331A (zh) 数据抽样方法及装置
CN109508405B (zh) 一种推荐视频的确定方法、装置、电子设备及存储介质
CN111259195A (zh) 一种视频推荐方法、装置、电子设备及可读存储介质
CN106227881B (zh) 一种信息处理方法及服务器
CN109379608A (zh) 一种直播间的推荐方法以及相关设备
WO2023168856A1 (zh) 一种关联场景推荐方法、装置、存储介质及电子装置
Boldi et al. Voting in social networks
CN113873330A (zh) 视频推荐方法、装置、计算机设备和存储介质
CN112150182B (zh) 多媒体文件推送方法和装置、存储介质及电子装置
CN109120955B (zh) 一种直播间的推荐方法以及相关设备
CN107730271B (zh) 基于虚拟交互对象的相似用户确定方法、装置及电子设备
CN104573113B (zh) 一种信息处理方法及服务器
CN106534984A (zh) 电视节目推送方法及装置
CN109213933A (zh) 内容项推荐方法、装置、设备及存储介质
CN109413461A (zh) 一种直播间的推荐方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant