CN109547808B - 数据处理方法、装置、服务器及存储介质 - Google Patents

数据处理方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN109547808B
CN109547808B CN201811400867.0A CN201811400867A CN109547808B CN 109547808 B CN109547808 B CN 109547808B CN 201811400867 A CN201811400867 A CN 201811400867A CN 109547808 B CN109547808 B CN 109547808B
Authority
CN
China
Prior art keywords
live broadcast
target
value
live
broadcast room
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811400867.0A
Other languages
English (en)
Other versions
CN109547808A (zh
Inventor
耿振健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201811400867.0A priority Critical patent/CN109547808B/zh
Publication of CN109547808A publication Critical patent/CN109547808A/zh
Application granted granted Critical
Publication of CN109547808B publication Critical patent/CN109547808B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26258Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists for generating a list of items to be played back in a given order, e.g. playlist, or scheduling item distribution according to such list
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4825End-user interface for program selection using a list of items to be played back in a given order, e.g. playlists
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Software Systems (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本申请是关于一种数据处理方法、装置、服务器及存储介质,属于信息处理领域。所述方法包括:根据多个直播间中每个直播间的直播内容信息和直播观看信息,确定每个直播间的内容属性值;根据每个直播间的直播观看信息,确定每个直播间的直播热度;根据每个直播间的内容属性值和直播热度,确定每个直播间的权重值;根据多个直播间的权重值,对多个直播间进行排序。由于内容属性值用于表征直播内容中包含目标直播内容的概率,能够反映直播内容的优质程度,因此,本申请可以综合根据直播内容的优质程度和直播热度对直播间进行排序,从而能够将内容优质和/或热度较高的直播间优先展示给用户,灵活性较高,提高了用户浏览兴趣和用户粘度。

Description

数据处理方法、装置、服务器及存储介质
技术领域
本申请涉及信息处理领域,尤其涉及一种数据处理方法、装置、服务器及存储介质。
背景技术
目前,直播技术正处于蓬勃发展的时期,但是,用户在直播平台观看直播时,通常都面临着数据量较大、数据更新快的特定,因此,为了提高用户观看直播的效率,直播平台通常需要对正在直播的海量直播间进行排序,以便根据排序结果筛选出优质直播间,向用户进行推荐。
相关技术中,通常根据用户的浏览习惯对直播间进行排序。具体地,针对目标用户,直播平台可以获取目标用户账号的历史浏览数据,以及预先选定好的兴趣标签,然后对历史浏览数据和选定的兴趣标签进行分析,确定目标用户账号的浏览习惯。之后,将待排序的多个直播间与目标用户账号的浏览习惯进行匹配,再根据该多个直播间与目标用户账号的浏览习惯之间的匹配度,对该多个直播间进行排序。
但是,根据用户的浏览习惯对直播间进行排序时,过于依赖用户的浏览习惯,因此,根据排序结果进行直播间推荐时,向用户展示的通常都是用户习惯浏览的直播间,缺乏新颖性,容易使用户产生浏览的疲倦感,用户粘度较低。
发明内容
本申请提供了一种数据处理方法、装置、服务器及存储介质,可以用于解决相关技术中根据用户的浏览习惯对直播间进行排序时,过于依赖用户的浏览习惯的问题。
根据本申请实施例的第一方面,提供了一种数据处理方法,包括:
获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
根据所述多个直播间的权重值,对所述多个直播间进行排序。
可选地,所述直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长;
所述根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,包括:
根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定所述每个直播间的第一内容属性子值;
根据所述每个直播间的第一内容属性子值,确定所述每个直播间的内容属性值。
可选地,所述根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定所述每个直播间的第一内容属性子值,包括:
根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,通过以下公式确定所述每个直播间的第一内容属性子值:
Figure BDA0001876272720000021
其中,turnover为所述每个直播间的第一内容属性子值,m和n分别是所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,k和l分别为所述每个直播间在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,y为第一常数。
可选地,所述直播内容信息还包括第一直播总数和第二直播总数,所述第一直播总数是指在距当前时间之前的第二预设时长内进行的包含目标直播内容的直播的总数,所述第二直播总数是指在距当前时间之前的第二预设时长内进行的所有直播的总数;
所述根据所述每个直播间的第一内容属性子值,确定所述每个直播间的内容属性值,包括:
确定所述每个直播间的第一直播总数和第二直播总数的比值,将所述比值与第二常数的乘积作为所述每个直播间的第二内容属性子值;
将所述每个直播间的第一内容属性子值、第二内容属性子值和第一预设值进行相加,得到所述每个直播间的内容属性值。
可选地,所述直播观看信息包括在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数;
所述根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度,包括:
根据所述每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数,通过以下公式确定所述每个直播间的直播热度:
Figure BDA0001876272720000031
其中,J为所述每个直播间的直播热度,c和g分别为所述每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,d和h分别为所述每个直播间正在进行的目标直播的直播时长和观看总人数,w为第三常数,q为第四常数。
可选地,所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
将所述每个直播间的内容属性值和直播热度进行相乘,得到所述每个直播间的权重值。
可选地,根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值之前,还包括:
获取目标用户账号的目标信息,所述目标信息至少包括观看直播的信息;
根据所述目标信息,确定目标属性值,所述目标属性值用于表征所述目标用户账号浏览推荐直播的概率;
所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值。
可选地,所述目标信息包括在距当前时间之前的第四预设时长内观看所有直播的第一总时长和观看推荐直播的第二总时长;
所述根据所述目标信息,确定所述目标属性值,包括:
根据所述第一总时长和所述第二总时长,确定第一目标属性子值;
根据所述第一目标属性子值,确定所述目标属性值。
可选地,所述根据所述第一总时长和所述第二总时长,确定第一目标属性子值,包括:
根据所述第一总时长和所述第二总时长,通过以下公式确定所述第一目标属性子值:
Figure BDA0001876272720000041
其中,recency为所述每个直播间的第一目标属性子值,a为所述第一总时长,b为所述第二总时长,x为第五常数。
可选地,所述目标信息还包括第一类型信息和第二类型信息,所述第一类型信息用于指示所述目标用户账号是否为新注册用户账号,所述第二类型信息用于指示所述目标用户账号是否为主播账号;
所述根据所述第一目标属性子值,确定所述目标属性值,包括:
根据所述第一类型信息,确定第二目标属性子值,其中,当所述第一类型信息指示所述目标用户账号是新注册用户账号时,所述第二目标属性子值为第二预设值,当所述第一类型信息指示所述目标用户账号不是新注册用户账号时,所述第二目标属性子值为第三预设值,且所述第二预设值大于所述第三预设值;
根据所述第二类型信息,确定第三目标属性子值,其中,当所述第二类型信息指示所述目标用户账号是主播账号时,所述第三目标属性子值为第四预设值,当所述第二类型信息指示所述目标用户账号不是主播账号时,所述第三目标属性子值为第五预设值,且所述第四预设值大于所述第五预设值;
将所述第一目标属性子值、第二目标属性子值和第三目标属性子值进行相加,得到所述目标属性值。
可选地,所述根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,通过以下公式确定所述每个直播间的权重值:
N=(T+Z)*J
其中,N为所述每个直播间的权重值,T为所述目标属性值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度。
可选地,所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值之前,还包括:
根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,所述防刷修正值用于限制直播间的曝光量;
所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值。
可选地,所述直播观看信息包括实时在线人数,所述根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,包括:
根据所述每个直播间的实时在线人数,通过以下公式确定所述每个直播间的防刷修正值:
Figure BDA0001876272720000051
其中,F为所述每个直播间的防刷修正值,p为所述每个直播间的实时在线人数。
可选地,所述根据所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值,包括:
根据所述每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定所述每个直播间的权重值:
N=Z*J*F
其中,N为所述每个直播间的权重值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度,F为所述每个直播间的防刷修正值。
可选地,所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值之前,还包括:
获取目标用户账号的目标信息,所述目标信息至少包括观看直播的信息;
根据所述目标信息,确定目标属性值,所述目标属性值用于表征所述目标用户账号浏览推荐直播的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,所述防刷修正值用于限制直播间的曝光量;
所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值。
可选地,所述根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定所述每个直播间的权重值:
N=(T+Z)*J*F
其中,N为所述每个直播间的权重值,T为所述目标属性值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度,F为所述每个直播间的防刷修正值。
可选地,所述根据所述多个直播间的权重值,对所述多个直播间进行排序,包括:
根据所述多个直播间的权重值,按照权重值从大到小的顺序,对所述多个直播间进行排序。
可选地,所述根据所述多个直播间的权重值,按照权重值从大到小的顺序,对所述多个直播间进行排序之后,还包括:
从排序后的所述多个直播间中,选择前预设数目个直播间;
将选择的直播间推荐给目标用户账号。
根据本申请实施例的第二方面,提供了一种数据处理装置,包括:
第一获取模块,用于获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
第一确定模块,用于对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;
第二确定模块,用于根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
第三确定模块,用于根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
排序模块,用于根据所述多个直播间的权重值,对所述多个直播间进行排序。
可选地,所述直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长;
所述第一确定模块具体用于:
根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定所述每个直播间的第一内容属性子值;
根据所述每个直播间的第一内容属性子值,确定所述每个直播间的内容属性值。
可选地,所述第一确定模块具体用于:
根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,通过以下公式确定所述每个直播间的第一内容属性子值:
Figure BDA0001876272720000071
其中,turnover为所述每个直播间的第一内容属性子值,m和n分别是所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,k和l分别为所述每个直播间在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,y为第一常数。
可选地,所述直播内容信息还包括第一直播总数和第二直播总数,所述第一直播总数是指在距当前时间之前的第二预设时长内进行的包含目标直播内容的直播的总数,所述第二直播总数是指在距当前时间之前的第二预设时长内进行的所有直播的总数;
所述第一确定模块具体用于:
确定所述每个直播间的第一直播总数和第二直播总数的比值,将所述比值与第二常数的乘积作为所述每个直播间的第二内容属性子值;
将所述每个直播间的第一内容属性子值、第二内容属性子值和第一预设值进行相加,得到所述每个直播间的内容属性值。
可选地,所述直播观看信息包括在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数;
所述第二确定模块具体用于:
根据所述每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数,通过以下公式确定所述每个直播间的直播热度:
Figure BDA0001876272720000072
其中,J为所述每个直播间的直播热度,c和g分别为所述每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,d和h分别为所述每个直播间正在进行的目标直播的直播时长和观看总人数,w为第三常数,q为第四常数。
可选地,所述第三确定模块具体用于:
将所述每个直播间的内容属性值和直播热度进行相乘,得到所述每个直播间的权重值。
可选地,所述装置还包括:
第二获取模块,用于获取目标用户账号的目标信息,所述目标信息至少包括观看直播的信息;
第四确定模块,用于根据所述目标信息,确定目标属性值,所述目标属性值用于表征所述目标用户账号浏览推荐直播的概率;
所述第三确定模块具体用于:
根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值。
可选地,所述目标信息包括在距当前时间之前的第四预设时长内观看所有直播的第一总时长和观看推荐直播的第二总时长;
所述第四确定模块具体用于:
根据所述第一总时长和所述第二总时长,确定第一目标属性子值;
根据所述第一目标属性子值,确定所述目标属性值。
可选地,所述第四确定模块具体用于:
根据所述第一总时长和所述第二总时长,通过以下公式确定所述第一目标属性子值:
Figure BDA0001876272720000081
其中,recency为所述每个直播间的第一目标属性子值,a为所述第一总时长,b为所述第二总时长,x为第五常数。
可选地,所述目标信息还包括第一类型信息和第二类型信息,所述第一类型信息用于指示所述目标用户账号是否为新注册用户账号,所述第二类型信息用于指示所述目标用户账号是否为主播账号;
所述第四确定模块具体用于:
根据所述第一类型信息,确定第二目标属性子值,其中,当所述第一类型信息指示所述目标用户账号是新注册用户账号时,所述第二目标属性子值为第二预设值,当所述第一类型信息指示所述目标用户账号不是新注册用户账号时,所述第二目标属性子值为第三预设值,且所述第二预设值大于所述第三预设值;
根据所述第二类型信息,确定第三目标属性子值,其中,当所述第二类型信息指示所述目标用户账号是主播账号时,所述第三目标属性子值为第四预设值,当所述第二类型信息指示所述目标用户账号不是主播账号时,所述第三目标属性子值为第五预设值,且所述第四预设值大于所述第五预设值;
将所述第一目标属性子值、第二目标属性子值和第三目标属性子值进行相加,得到所述目标属性值。
可选地,所述第三确定模块用于:
根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,通过以下公式确定所述每个直播间的权重值:
N=(T+Z)*J
其中,N为所述每个直播间的权重值,T为所述目标属性值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度。
可选地,所述装置还包括:
第五确定模块,用于根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,所述防刷修正值用于限制直播间的曝光量;
所述第三确定模块具体用于:
根据所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值。
可选地,所述直播观看信息包括实时在线人数,所述第五确定模块具体用于:
根据所述每个直播间的实时在线人数,通过以下公式确定所述每个直播间的防刷修正值:
Figure BDA0001876272720000091
其中,F为所述每个直播间的防刷修正值,p为所述每个直播间的实时在线人数。
可选地,所述第三确定模块具体用于:
根据所述每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定所述每个直播间的权重值:
N=Z*J*F
其中,N为所述每个直播间的权重值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度,F为所述每个直播间的防刷修正值。
可选地,所述装置还包括:
第二获取模块,用于获取目标用户账号的目标信息,所述目标信息至少包括观看直播的信息;
第四确定模块,用于根据所述目标信息,确定目标属性值,所述目标属性值用于表征所述目标用户账号浏览推荐直播的概率;
第五确定模块,用于根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,所述防刷修正值用于限制直播间的曝光量;
所述第三确定模块具体用于:
根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值。
可选地,所述第三确定模块具体用于:
根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定所述每个直播间的权重值:
N=(T+Z)*J*F
其中,N为所述每个直播间的权重值,T为所述目标属性值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度,F为所述每个直播间的防刷修正值。
可选地,所述排序模块具体用于:
根据所述多个直播间的权重值,按照权重值从大到小的顺序,对所述多个直播间进行排序。
可选地,所述装置还包括:
选择模块,用于从排序后的所述多个直播间中,选择前预设数目个直播间;
推荐模块,用于将选择的直播间推荐给目标用户账号。
根据本申请实施例的第三方面,提供了一种服务器,所述服务器包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
根据所述多个直播间的权重值,对所述多个直播间进行排序。
根据本申请实施例的第四方面,提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算机的处理器执行时,使得计算机能够执行下述数据处理方法:
获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
根据所述多个直播间的权重值,对所述多个直播间进行排序。
根据本申请实施例的第五方面,提供一种计算机程序产品,当其在计算机上运行时,使得计算机执行下述数据处理方法:
获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
根据所述多个直播间的权重值,对所述多个直播间进行排序。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请实施例中,可以根据多个直播间中每个直播间的直播内容信息和直播观看信息,分别确定每个直播间的内容属性值和直播热度,然后根据每个直播间的内容属性值和直播热度,确定每个直播间的权重值,根据多个直播间的权重值,对多个直播间进行排序。由于直播间的内容属性值用于表征直播内容中包含目标直播内容的概率,能够反映直播内容的优质程度,因此,本申请可以综合根据直播内容的优质程度和直播热度对直播间进行排序,从而能够将内容优质和/或热度较高的直播间优先展示给用户,相对于根据用户的浏览习惯对直播间进行排序的方案,避免了向用户优先展示的都是用户习惯浏览的直播间、缺乏新颖性的问题,能够向用户展示更加丰富多样的直播,提高了用户的浏览兴趣,进而提高了用户粘度。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是根据一示例性实施例示出的一种直播系统示意图。
图2是根据一示例性实施例示出的一种数据处理方法的流程图。
图3是根据一示例性实施例示出的另一种数据处理方法的流程图。
图4是根据一示例性实施例示出的一种数据处理装置的框图。
图5是根据一示例性实施例示出的一种数据处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在对本申请实施例进行详细地解释说明之前,先对本申请实施例的应用场景予以说明。
本申请实施例提供的排序方法应用于对直播平台提供的多个直播间进行排序的场景中,具体可以应用于对某个用户账号已关注或者某个用户设备已显示的多个直播间重新进行排序,也可以应用于对当前正在直播多个直播间进行排序,然后根据排序结果进行直播推荐,或者,应用于对已推荐给用户的多个直播间进行排序,当然,也可以应用于其他场景中。
另外,本申请实施例提供的数据处理方法的执行主体可以为终端或服务器,终端包括手机、平板电脑或计算机等,服务器可以为直播平台的后台服务器。可选地,该排序方法的执行主体可以为终端中安装的直播客户端。
接下来,对本申请实施例的实施环境进行介绍。
本申请实施例提供的数据处理方法应用于直播系统中。图1是根据一示例性实施例示出的一种直播系统示意图,如图1所示,该直播系统包括以包括第一终端120、服务器集群140和第二终端160。
第一终端120可以通过无线网络或有线网络与服务器集群140连接。第一终端120是第一用户使用的终端,具体可以是主播终端,也可以是观众终端。可选地,第一终端120安装有直播客户端,第一用户可以通过直播客户端进行直播,也可以通过直播客户端浏览直播平台推荐的直播间。可选地,第一终端120的直播客户端登录有第一用户账号。
第二终端140可以通过无线网络或有线网络与服务器集群140连接。第二终端140是第二用户使用的终端,具体可以是主播终端,也可以是观众终端。可选地,第二终端140安装有直播客户端,第二用户可以通过直播客户端进行直播,也可以通过直播客户端浏览直播平台推荐的直播间。可选地,第二终端140的直播客户端登录有第二用户账号。
服务器集群140包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。服务器集群140用于为直播客户端提供后台服务,例如,对正在直播的多个直播间进行排序。可选地,服务器集群140承担主要计算工作,第一终端120和第二终端160承担次要计算工作;或者,服务器集群140承担次要计算工作,第一终端120和第二终端160承担主要计算工作;或者,服务器集群140、第一终端120和第二终端160三者之间采用分布式计算架构进行协同计算。
第一终端120可以泛指多个终端中的一个,第二终端160可以泛指多个终端中的一个,本实施例仅以第一终端120和第二终端160来举例说明。本领域技术人员可以知晓,上述终端的数量可以更多或更少。比如上述终端可以仅为一个,或者上述终端为几十个或几百个,或者更多数量。本申请实施例对终端的数量和设备类型不加以限定。
接下来,对本申请实施例提供的数据处理方法进行详细介绍。
图2是根据一示例性实施例示出的一种数据处理方法的流程图,该方法的执行主体可以为终端或服务器,本申请实施例仅以服务器为执行主体为例进行说明。如图2所示,该方法包括以下步骤:
在步骤201中,获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息。
其中,该多个直播间可以为正在直播的直播间,具体可以为正在直播的全部或部分直播间。可选地,该多个直播间可以为目标用户账号已关注或已收藏的多个正在进行直播的直播间,或者为直播平台当前正在进行直播的全部直播间等。当然,该多个直播间也可以包括未进行直播的直播间,本申请实施例对此不做限定。
本申请实施例中,在对直播间排序时,可以先获取多个直播间中每个直播间的直播内容信息和直播观看信息。
需要说明的是,直播内容信息用于指示每个直播间直播的内容,用于确定直播内容的优质程度。本申请中,可以通过计算直播间内所直播内容中目标直播内容的占比来衡量直播内容的优质程度,目标直播内容的占比越高,表示内容越优质,因此,直播内容信息以是与计算直播内容中目标直播内容的占比相关的信息。可选地,直播内容信息可以包括正在进行的目标直播中包含目标直播内容的直播时长和目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长。
可选地,正在进行的目标直播中包含目标直播内容的直播时长可以通过对目标直播进行识别得到。例如,当目标直播内容为歌唱内容时,目标直播中包含目标直播内容的直播时长可以通过对目标直播的音频进行声纹识别得到。当目标直播内容为舞蹈内容时,目标直播中包含目标直播内容的直播时长可以通过对目标直播的直播视频进行识别得到。当然,其他目标直播内容也可以通过其他方式对目标直播进行识别得到,本申请实施例在此不再一一列举。同理,在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长也可以通过对进行的所有直播中的每个直播进行识别得到。
进一步地,直播内容信息还可以包括第一直播总数和第二直播总数,第一直播总数是指在距当前时间之前的第二预设时长内进行的包含目标直播内容的直播的总数,第二直播总数是指在距当前时间之前的第二预设时长内进行的所有直播的总数。
其中,第一预设时长和第二预设时长可以相同,也可以不同。而且,第一预设时长和第二预设时长可以预先设置,具体可以由服务器默认设置,也可以由技术人员根据需要进行设置。例如,第一预设时长和第二预设时长相同,具体可以为30天、20天或7天等。
需要说明的是,直播观看信息是指直播间被用户点击观看的相关信息,具体可以包括直播时长和在线人数等与计算直播间热度相关的信息。可选地,直播观看信息可以包括在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数。其中,目标直播的直播时长是指从目标直播开始直播到当前时间之间的时长,目标直播的观看总人数是指从目标直播开始直播到当前时间的时间范围内进入到直播间的总人数。另外,直播观看信息还可以包括实时在线人数。
其中,第三预设时长可以预先设置,具体可以由服务器默认设置,也可以由技术人员根据需要进行设置。例如,第三预设时长可以为30天、20天或7天等,本申请实施例对该第三预设时长的具体数值不做限定。
在步骤202中,对于该多个直播间中的每个直播间,根据每个直播间的直播内容信息,确定每个直播间的内容属性值,内容属性值用于表征直播内容包含目标直播内容的概率。
其中,目标直播内容为可以为预先设置的优质直播内容,如优质才艺表演内容。示例的,目标直播内容可以为歌唱内容、舞蹈内容、料理内容、吃播内容、萌宠内容或游戏内容等才艺表演内容。目标直播内容可以预先设置,具体可以由服务器默认设置,也可以由技术人员根据需要预先设置。可选地,目标直播内容还可以为目标用户账号预先设置的感兴趣的直播内容,或者为目标用户账号习惯观看的直播内容等。
其中,内容属性值可以指示直播间的直播内容中包含优质直播内容的概率,也即是,可以指示直播内容的优质程度,且内容属性值越大,表示直播内容中目标直播内容的占比越大,直播内容越优质。通过确定每个直播间的内容属性值,可以便于后续根据直播内容的优质程度对直播间进行排序,从而能够将包含优质内容直播间排序在前。
可选地,可以根据每个直播间的直播内容信息,利用对数函数确定每个直播间的内容属性值。具体地,根据每个直播间的直播内容信息,确定每个直播间的内容属性值包括以下两种实现方式:
第一种实现方式:若直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,则根据每个直播间正在进行的目标直播中包含目标直播内容的直播时长和目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定每个直播间的第一内容属性子值,将每个直播间的第一内容属性子值确定为每个直播间的内容属性值。
具体地,可以利用对数函数确定每个直播间的第一内容属性子值。例如,可以根据每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,通过以下公式(1)确定每个直播间的第一内容属性子值:
Figure BDA0001876272720000161
其中,turnover为每个直播间的第一内容属性子值,m和n分别是每个直播间正在进行的目标直播中包含目标直播内容的直播时长和目标直播已直播的时长,k和l分别为每个直播间在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,y为第一常数。其中,第一常数可以由技术人员预先设置,例如,第一常数可以为50。
第二种实现方式:若直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和目标直播已直播的时长,在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,以及第一直播总数和第二直播总数,则根据每个直播间正在进行的目标直播中包含目标直播内容的直播时长和目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定每个直播间的第一内容属性子值;根据每个直播间的第一直播总数和第二直播总数,确定每个直播间的第二内容属性子值;将每个直播间的第一内容属性子值、第二内容属性子值和第一预设值进行相加,得到每个直播间的内容属性值。
其中,第一直播总数是指在距当前时间之前的第二预设时长内进行的包含目标直播内容的直播的总数,第二直播总数是指在距当前时间之前的第二预设时长内进行的所有直播的总数。第一预设值可以由技术人员根据需求预先设置得到,例如,第一预设值为0或20等。
具体地,可以确定每个直播间的第一直播总数和第二直播总数的比值,将比值与第二常数的乘积作为每个直播间的第二内容属性子值。例如,可以根据每个直播间的第一直播总数和第二直播总数,通过下述公式(2)确定每个直播间的第二内容属性子值:
pass=(i/j)*r (2)
其中,pass为每个直播间的第二内容属性子值,i为每个直播间的第一直播总数,j为每个直播间的第二直播总数,r为第二常数。其中,第二常数可以由技术人员预先设置,例如,第二常数可以为10。
具体地,可以根据每个直播间的第一内容属性子值、第二内容属性子值和第一预设值,通过以下公式(3)确定每个直播间的内容属性值:
Z=o+turnover+pass (3)
其中,Z为每个直播间的内容属性值,o为第一预设值,turnover为每个直播间的第一内容属性子值,pass为每个直播间的第二内容属性子值。
在步骤203中,根据每个直播间的直播观看信息,确定每个直播间的直播热度。
其中,直播热度用于指示直播间被观看的热度,且直播热度越大,表示直播间被观看的人数越多。通过确定每个直播间的直播热度,可以根据直播热度对直播间进行排序,从而能够将直播热度较高的直播间排序在前。
可选地,可以根据每个直播间的直播观看信息,利用对数函数确定每个直播间的直播热度。
具体地,根据每个直播间的直播观看信息,确定每个直播间的直播热度包括:当直播观看信息包括在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数时,根据每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数,确定每个直播间的直播热度。
可选地,可以利用对数函数确定每个直播间的直播热度。例如,可以根据每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数,通过以下公式(4)确定每个直播间的直播热度:
Figure BDA0001876272720000171
其中,J为每个直播间的直播热度,c和g分别为每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,d和h分别为每个直播间正在进行的目标直播的直播时长和观看总人数,w为第三常数,q为第四常数。其中,w和q可以由技术人员根据需要预先进行设置,示例的,w为5,q为1。
通过按照上述公式确定每个直播间的直播热度,可以使得直播间的直播进入中后期、用户量基本饱和时,直播热度提升,进而提升直播间的权重值,如此,可以使得该直播间的排序靠前,达到迅速提高曝光量以及吸引到足够的用户量的目的。
在步骤204中,根据每个直播间的内容属性值和直播热度,确定每个直播间的权重值。
具体地,可以将每个直播间的内容属性值和直播热度进行相乘,得到每个直播间的权重值。例如,可以根据根据每个直播间的内容属性值和直播热度,通过以下公式(5)确定每个直播间的权重值:
N=Z*J (5)
其中,N为每个直播间的权重值,Z为每个直播间的内容属性值,J为每个直播间的直播热度。
在另一实施例中,在步骤203之前,还可以获取目标用户账号的目标信息,根据目标信息,确定目标属性值,然后根据目标属性值,以及每个直播间的内容属性值和直播热度,确定每个直播间的权重值。
其中,目标用户账号是指需要为其提供直播间排序服务的用户账号,具体可以为任一观众账号。观众账号是指观众终端登录的用户账号。目标用户账号可以为目标用户的名称或编号等。
其中,目标信息至少包括目标用户账号观看直播的信息。例如,目标信息可以包括目标用户账号在距当前时间之前的第四预设时长内观看所有直播的第一总时长,以及在距当前时间之前的第四预设时长内观看推荐直播的第二总时长。所述所有直播包括用户主动搜索查看的直播和推荐直播,推荐直播是指直播平台推荐给用户的直播。其中,第四预设时长可以预先设置,具体可以由服务器默认设置,也可以由技术人员根据需要进行设置。例如,第四预设时长可以为30天、20天或7天等。
可选地,目标信息还可以包括目标用户账号的一些固有用户属性信息。例如,目标信息可以包括用户类型信息,用户类型信息包括第一类型信息和/或第二类型信息。第一类型信息用于指示目标用户账号是否为新注册用户账号,第二类型信息用于指示目标用户账号是否为主播账号。可选地,目标信息还可以包括目标用户账号预先选定的兴趣标签,该兴趣标签用于指示目标用户账号感兴趣的直播类型。
其中,目标属性值用于表征目标用户账号浏览推荐直播的概率,也即是,用于指示向目标用户账号推荐直播后,目标用户账号会查看所推荐直播的概率,且目标属性值越大,表示目标用户账号观看推荐直播的概率越大。可选地,目标属性值还可以表征每个直播间的直播类型与目标用户账号习惯观看的直播类型的匹配度,且目标属性值越大,表示与目标用户账号习惯观看的直播类型的匹配度越高。当目标属性值还用于指示每个直播间的直播类型与目标用户账号习惯观看的直播类型的匹配程度时,可以根据用户偏好对直播间进行排序,从而能够将用户偏好的直播间排序在前。
具体地,根据目标信息,确定每个直播间的目标属性值可以包括以下两种实现方式:
第一种实现方式:当目标信息包括在距当前时间之前的第四预设时长内观看所有直播的第一总时长和观看推荐直播的第二总时长时,可以根据第一总时长和第二总时长,确定每个直播间的第一目标属性子值,将每个直播间的第一目标属性子值确定为每个直播间的目标属性值。
具体地,可以根据第一总时长和第二总时长,通过以下公式(6)确定每个直播间的第一目标属性子值:
Figure BDA0001876272720000191
其中,recency为每个直播间的第一目标属性子值,a为第一总时长,b为第二总时长,x为第五常数。第五常数可以由技术人员预先设置,可选地,第五常数为10。
可选地,所述推荐直播是与每个直播间的直播类型相同的直播。每个直播间的直播类型可以根据对应的直播间标签确定,直播间标签用于指示直播间的直播类型。例如,若某个直播间的直播类型为歌唱类型,则可以获取目标用户账号在当前时间之前的第四预设时长内观看所有直播的第一总时长,以及在当前时间之前的第四预设时长内观看歌唱类型的推荐直播的第二总时长,然后根据第一总时长和第二总时长,利用上述公式(6)确定第一目标属性子值。当推荐直播是与每个直播间的直播类型相同的直播时,确定得到的第一目标属性子值还可以指示每个直播间的直播类型与目标用户账号习惯观看的直播类型的匹配度,能够在一定程度上反映用户偏好。
第二种实现方式:当目标信息包括在距当前时间之前的第四预设时长内观看所有直播的第一总时长和观看推荐直播的第二总时长,以及第一类型信息和第二类型信息时,可以根据第一总时长和第二总时长,确定每个直播间的第一目标属性子值,根据每个直播间的第一类型信息,确定每个直播间的第二目标属性子值,根据每个直播间的第二类型信息,确定每个直播间的第三目标属性子值,然后,将每个直播间的第一目标属性子值、第二目标属性子值和第三目标属性子值进行相加,得到每个直播间的目标属性值。
其中,第一类型信息用于指示目标用户账号是否为新注册用户账号,第二类型信息用于指示目标用户账号是否为主播账号。
需要说明的是,由于新注册用户账号相对于老注册用户而言时,观看推荐直播概率较大,因此,当目标用户账号为新注册用户账号时,可以将第二目标属性子值设置的较大,当目标用户账号不是新注册用户账号时,可以将第二目标属性子值设置的较小。另外,由于主播账号相对与普通账号而言,观看推荐直播概率也较大,因此,当目标用户账号为新主播账号时,可以将第三目标属性子值设置的较大,当目标用户账号不是主播账号时,可以将第三目标属性子值设置的较小。
可选地,根据每个直播间的第一类型信息,确定每个直播间的第二目标属性子值包括:当第一类型信息指示目标用户账号是新注册用户账号时,第二目标属性子值为第二预设值;当第一类型信息指示目标用户账号不是新注册用户账号时,第二目标属性子值为第三预设值。第二预设值大于第三预设值。示例的,第二预设值为50,第三预设值为45。
例如,若第二预设值为50,第三预设值为45,目标用户账号是新注册用户账号,则第二目标属性子值为50。
可选地,根据每个直播间的第二类型信息,确定每个直播间的第三目标属性子值包括:当第二类型信息指示目标用户账号是主播账号时,第三目标属性子值为第四预设值;当第二类型信息指示目标用户账号不是主播账号时,第三目标属性子值为第五预设值。第四预设值大于第五预设值。示例的,第四预设值为50,第五预设值为0。
例如,若第四预设值为50,第五预设值为0,目标用户账号为主播账号,则第三目标属性子值为50。
分别确定出每个直播间的第一目标属性子值、第二目标属性子值和第三目标属性子值之后,将每个直播间的第一目标属性子值、第二目标属性子值和第三目标属性子值进行相加,即可得到每个直播间的目标属性值。
例如,可以通过以下公式(7)确定每个直播间的目标属性值:
T=recency+cooperation_type+reward (7)
其中,T为目标属性值,recency为第一目标属性子值,cooperation_type为第二目标属性子值,reward为第三目标属性子值。
可选地,还可以确定第二目标属性子值和第三目标属性子值中的任一种,将每个直播间的第二目标属性子值和第三目标属性子值中的任一种,与每个直播间的第一目标属性子值进行相加,得到每个直播间的目标属性值。
在该实施例中,可以根据目标属性值,以及每个直播间的内容属性值和直播热度,通过以下公式(8)确定每个直播间的权重值:
N=(T+Z)*J (8)
其中,N为每个直播间的权重值,T为目标属性值,Z为每个直播间的内容属性值,J为每个直播间的直播热度。
在另一实施例中,在步骤203之前,还可以根据每个直播间的直播观看信息,确定每个直播间的防刷修正值,然后,根据每个直播间的内容属性值、直播热度和防刷修正值,确定每个直播间的权重值。
其中,防刷修正值用于限制直播间的曝光量。具体可以用于在直播间的在线人数较多时,限制直播间的曝光量,以将在线用户吸引到其他直播间内,达到分流的目的。防刷修正值可以根据直播间的实时在线人数确定得到,且防刷修正值与实时在线人数成反比,直播间的实时在线人数越多,则直播间的防刷修正值越小。
可选地,可以根据每个直播间的直播观看信息,通过对数函数和指示函数确定每个直播间的防刷修正值。通过对数函数和指示函数确定每个直播间的防刷修正值,可以将每个直播间的防刷修正值与其他属性值进行归一化,使得防刷修正值的量纲趋近于其他属性值的量纲,便于这些属性值在相近量纲下进行比较和计算。
具体地,当直播观看信息包括实时在线人数时,可以根据每个直播间的实时在线人数,通过下述公式(9)确定每个直播间的防刷修正值:
Figure BDA0001876272720000211
其中,F为每个直播间的防刷修正值,p为每个直播间的实时在线人数。
由公式(9)可知,防刷修正值与实时在线人数成反比,直播间的实时在线人数越多,则直播间的防刷修正值越小。
在该实施例中,可以根据每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式(10)确定每个直播间的权重值:
N=Z*J*F (10)
其中,N为每个直播间的权重值,Z为每个直播间的内容属性值,J为每个直播间的直播热度,F为每个直播间的防刷修正值。
在另一实施例中,在步骤203之前,还可以获取目标用户账号的目标信息,根据目标信息,确定目标属性值,根据每个直播间的直播观看信息,确定每个直播间的防刷修正值,防刷修正值用于限制直播间的曝光量,然后根据目标属性值,以及每个直播间的内容属性值、直播热度和防刷修正值,确定每个直播间的权重值。
具体地,可以根据目标属性值,以及每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式(11)确定每个直播间的权重值:
N=(T+Z)*J*F (11)
其中,N为每个直播间的权重值,T为目标属性值,Z为每个直播间的内容属性值,J为每个直播间的直播热度,F为每个直播间的防刷修正值。
在步骤205中,根据多个直播间的权重值,对多个直播间进行排序。
具体地,可以根据多个直播间的权重值,按照权重值从大到小的顺序,对多个直播间进行排序。
进一步地,在对多个直播间进行排序后,还可以从排序后的多个直播间中,选择前预设数目个直播间,然后将选择的直播间推荐给目标用户账号。其中,该预设数目可以由技术人员根据需要预先设置得到,也可以根据目标用户账号需要的直播间数目确定。示例的,该预设数目可以为3、5或10等。
本申请实施例中,可以根据多个直播间中每个直播间的直播内容信息和直播观看信息,分别确定每个直播间的内容属性值和直播热度,然后根据每个直播间的内容属性值和直播热度,确定每个直播间的权重值,根据多个直播间的权重值,对多个直播间进行排序。由于直播间的内容属性值用于表征直播内容中包含目标直播内容的概率,能够反映直播内容的优质程度,因此,本申请可以综合根据直播内容的优质程度和直播热度对直播间进行排序,从而能够将内容优质和/或热度较高的直播间优先展示给用户,相对于根据用户的浏览习惯对直播间进行排序的方案,避免了向用户优先展示的都是用户习惯浏览的直播间、缺乏新颖性的问题,能够向用户展示更加丰富多样的直播,提高了用户的浏览兴趣,进而提高了用户粘度。
另外,通过对利用对数函数确定每个直播间的内容属性值和直播热度,以及利用对数函数和指数函数确定每个直播间的防刷修正值,还可以达到对目标属性值、内容属性值、直播热度和防刷修正值进行归一化处理的目的,使得目标属性值、内容属性值、直播热度和防刷修正值的量纲较为相近,便于综合处理这些参数,从而确定直播间的权重值。
另外,本申请实施例中,通过对目标属性值、内容属性值、直播热度和防刷修正值的计算公式中的各个参数进行灵活调整,还可以调整排序的收敛方向,使得排序方法更依赖于某个指标,从而满足更多的业务需求。比如,可以根据业务需求灵活调整各个确定公式中的常数值,进而调整排序的收敛方向。
图3是根据一示例性实施例示出的另一种数据处理方法的流程图,该方法的执行主体可以为终端或服务器,本申请实施例仅以服务器为执行主体为例进行说明。如图3所示,该方法包括以下步骤:
在步骤301中,获取标用户账号的目标信息,以及待排序的多个直播间中每个直播间的直播内容信息和直播观看信息。
其中,目标信息包括在最近30天内观看所有直播的第一总时长a和观看推荐直播的第二总时长b,以及第一类型信息和第二类型信息,第一类型信息用于指示目标用户账号是否为新注册用户账号,第二类型信息用于指示目标用户账号是否为主播账号。
其中,直播内容信息包括正在进行的目标直播中包含歌唱内容的直播时长m和目标直播已直播的时长n,在最近30天内进行的所有直播中包含歌唱内容的最长直播时长k和最短直播时长l,以及第一直播总数i和第二直播总数j。其中,第一直播总数i是指在最近30天内进行的包含歌唱内容的直播的总数,第二直播总数j是指最近30天内进行的所有直播的总数。
其中,直播观看信息包括在最近30天内进行的所有直播的平均时长c和平均在线人数g,正在进行的目标直播的直播时长d和观看总人数h,以及实时在线人数p。
在步骤302中,根据目标信息,确定目标属性值T。
1)根据目标用户账号在最近30天内观看所有直播的第一总时长a和观看推荐直播的第二总时长b,通过以下公式(12)确定第一目标属性子值:
Figure BDA0001876272720000231
其中,recency为每个直播间的第一目标属性子值,a为第一总时长,b为第二总时长,x为第一常数。
2)根据每个直播间的第一类型信息,确定每个直播间的第二目标属性子值。
其中,当第一类型信息指示目标用户账号为新注册用户时,第二目标属性子值为50;当第一类型信息指示目标用户账号不是新注册用户时,第二目标属性子值为45。
3)根据每个直播间的第二类型信息,确定每个直播间的第三目标属性子值。
其中,当第二类型信息指示目标用户账号为主播账号时,第三目标属性子值为50;当第二类型信息指示目标用户账号不是主播账号时,第三目标属性子值为0。
4)根据每个直播间的第一目标属性子值、第二目标属性子值和第三目标属性子值,通过以下公式(13)确定每个直播间的目标属性值:
T=recency+cooperation_type+reward(13)
其中,T为目标属性值,recency为第一目标属性子值,cooperation_type为第二目标属性子值,reward为第三目标属性子值。
在步骤303中,根据每个直播间的直播内容信息,利用对数函数确定每个直播间的内容属性值Z。
1)根据每个直播间正在进行的目标直播中包含歌唱内容的直播时长m和目标直播已直播的时长n,以及在最近30天内进行的所有直播中包含歌唱内容的最长直播时长k和最短直播时长l,通过以下公式(14)确定每个直播间的第一内容属性子值:
Figure BDA0001876272720000241
其中,turnover为每个直播间的第一内容属性子值,m和n分别是每个直播间正在进行的目标直播中包含目标直播内容的直播时长和目标直播已直播的时长,k和l分别为每个直播间在距当前时间之前的第二预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长。
2)根据第一直播总数i和第二直播总数j,通过以下公式(15)确定每个直播间的第二内容属性子值:
pass=(i/j)*10 (15)
其中,pass为每个直播间的第二内容属性子值,i为每个直播间的第一直播总数,j为每个直播间的第二直播总数。
3)根据每个直播间的第一内容属性子值和第二内容属性子值,通过以下公式(16)确定每个直播间的内容属性值Z:
Z=20+turnover+pass (16)
其中,Z为每个直播间的内容属性值,turnover为每个直播间的第一内容属性子值,pass为每个直播间的第二内容属性子值。
在步骤304中,根据每个直播间的直播观看信息,利用对数函数确定所述每个直播间的直播热度J。
具体地,根据每个直播间在最近30天内进行的所有直播的平均时长c和平均在线人数g,正在进行的目标直播的直播时长d和观看总人数h,通过以下公式(17)确定每个直播间的直播热度J:
Figure BDA0001876272720000242
其中,J为每个直播间的直播热度,c和g分别为每个直播间在最近30天内进行的所有直播的平均时长和平均在线人数,d和h分别为每个直播间正在进行的目标直播的直播时长和观看总人数。
在步骤305中,根据每个直播间的直播观看信息,利用对数函数和指数函数确定每个直播间的防刷修正值F。
具体地,根据每个直播间的实时在线人数p,通过以下公式(18)确定每个直播间的防刷修正值F:
Figure BDA0001876272720000251
其中,F为每个直播间的防刷修正值,p为每个直播间的实时在线人数。
在步骤306中,根据目标属性值T,以及每个直播间的内容属性值Z、直播热度J和防刷修正值F,确定每个直播间的权重值N。
具体地,可以根据目标属性值T,以及每个直播间的内容属性值Z、直播热度J和防刷修正值F,通过以下公式(19)确定每个直播间的权重值N:
N=(T+Z)*J*F (19)
其中,N为每个直播间的权重值,T为每个直播间的目标属性值,Z为每个直播间的内容属性值,J为每个直播间的直播热度,F为每个直播间的防刷修正值。
在步骤307中,根据多个直播间的权重值,对多个直播间进行排序。
具体地,可以根据多个直播间的权重值,按照权重值从大到小的顺序,对多个直播间进行排序。
进一步地,在对多个直播间进行排序后,还可以从排序后的多个直播间中,选择前预设数目个直播间,然后将选择的直播间推荐给目标用户账号。
在另一实施例中,确定多个短视频的权重值,然后根据多个短视频的权重值以及多个直播间的权重,对多个短视频和多个直播间进行排序。短视频是指时长小于预设时长的录制视频。
具体地,可以获取目标用户账号的目标信息,根据目标信息确定每个短视频的权重值。例如,可以按照上述根据目标用户账号的目标信息,确定每个直播间的目标属性值的方式,根据目标用户账号的目标信息,确定每个短视频的目标属性值,然后将每个短视频的目标属性值和第六预设值进行相加,得到每个短视频的权重值。其中,第六预设值可以由技术人员根据需求预先设置,可选地,第六预设值为16。也即是,对于短视频来说,内容属性值为固定的第六预设值,直播热度和防刷修正值均为1。
本申请实施例中,可以根据多个直播间中每个直播间的直播内容信息和直播观看信息,分别确定每个直播间的内容属性值和直播热度,然后根据每个直播间的内容属性值和直播热度,确定每个直播间的权重值,根据多个直播间的权重值,对多个直播间进行排序。由于直播间的内容属性值用于表征直播内容中包含目标直播内容的概率,能够反映直播内容的优质程度,因此,本申请可以综合根据直播内容的优质程度和直播热度对直播间进行排序,从而能够将内容优质和/或热度较高的直播间优先展示给用户,相对于根据用户的浏览习惯对直播间进行排序的方案,避免了向用户优先展示的都是用户习惯浏览的直播间、缺乏新颖性的问题,能够向用户展示更加丰富多样的直播,提高了用户的浏览兴趣,进而提高了用户粘度。另外,通过对利用对数函数确定每个直播间的内容属性值和直播热度,以及利用对数函数和指数函数确定每个直播间的防刷修正值,还可以将内容属性值、直播热度、防刷修正值的量纲趋近于目标属性值的量纲,达到对目标属性值、内容属性值、直播热度和防刷修正值进行归一化处理的目的,便于综合确定直播间的权重值。
图4是根据一示例性实施例示出的一种数据处理装置的框图。参照图4,该装置包括第一获取模块401,第一确定模块402,第二确定模块403,第三确定模块404和排序模块405。
第一获取模块401,用于获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
第一确定模块402,用于对于该多个直播间中的每个直播间,根据该每个直播间的直播内容信息,确定该每个直播间的内容属性值,该内容属性值用于表征直播内容中包含目标直播内容的概率;
第二确定模块403,用于根据该每个直播间的直播观看信息,确定该每个直播间的直播热度;
第三确定模块404,用于根据该每个直播间的内容属性值和直播热度,确定该每个直播间的权重值;
排序模块405,用于根据该多个直播间的权重值,对该多个直播间进行排序。
可选地,该直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和该目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长;
该第一确定模块402具体用于:
根据该每个直播间正在进行的目标直播中包含目标直播内容的直播时长和该目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定该每个直播间的第一内容属性子值;
根据该每个直播间的第一内容属性子值,确定该每个直播间的内容属性值。
可选地,该第一确定模块402具体用于:
根据该每个直播间正在进行的目标直播中包含目标直播内容的直播时长和该目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,通过以下公式确定该每个直播间的第一内容属性子值:
Figure BDA0001876272720000271
其中,turnover为该每个直播间的第一内容属性子值,m和n分别是该每个直播间正在进行的目标直播中包含目标直播内容的直播时长和该目标直播已直播的时长,k和l分别为该每个直播间在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,y为第一常数。
可选地,该直播内容信息还包括第一直播总数和第二直播总数,该第一直播总数是指在距当前时间之前的第二预设时长内进行的包含目标直播内容的直播的总数,该第二直播总数是指在距当前时间之前的第二预设时长内进行的所有直播的总数;
该第一确定模块402具体用于:
确定该每个直播间的第一直播总数和第二直播总数的比值,将该比值与第二常数的乘积作为该每个直播间的第二内容属性子值;
将该每个直播间的第一内容属性子值、第二内容属性子值和第一预设值进行相加,得到该每个直播间的内容属性值。
可选地,该直播观看信息包括在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数;
该第二确定模块403具体用于:
根据该每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数,通过以下公式确定该每个直播间的直播热度:
Figure BDA0001876272720000281
其中,J为该每个直播间的直播热度,c和g分别为该每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,d和h分别为该每个直播间正在进行的目标直播的直播时长和观看总人数,w为第三常数,q为第四常数。
可选地,该第三确定模块404具体用于:
将该每个直播间的内容属性值和直播热度进行相乘,得到该每个直播间的权重值。
可选地,该装置还包括:
第二获取模块,用于获取目标用户账号的目标信息,该目标信息至少包括观看直播的信息;
第四确定模块,用于根据该目标信息,确定目标属性值,该目标属性值用于表征该目标用户账号浏览推荐直播的概率;
该第三确定模块404具体用于:
根据该目标属性值,以及该每个直播间的内容属性值和直播热度,确定该每个直播间的权重值。
可选地,该目标信息包括在距当前时间之前的第四预设时长内观看所有直播的第一总时长和观看推荐直播的第二总时长;
该第四确定模块具体用于:
根据该第一总时长和该第二总时长,确定第一目标属性子值;
根据该第一目标属性子值,确定该目标属性值。
可选地,该第四确定模块具体用于:
根据该第一总时长和该第二总时长,通过以下公式确定该第一目标属性子值:
Figure BDA0001876272720000282
其中,recency为该每个直播间的第一目标属性子值,a为该第一总时长,b为该第二总时长,x为第五常数。
可选地,该目标信息还包括第一类型信息和第二类型信息,该第一类型信息用于指示该目标用户账号是否为新注册用户账号,该第二类型信息用于指示该目标用户账号是否为主播账号;
该第四确定模块具体用于:
根据该第一类型信息,确定第二目标属性子值,其中,当该第一类型信息指示该目标用户账号是新注册用户账号时,该第二目标属性子值为第二预设值,当该第一类型信息指示该目标用户账号不是新注册用户账号时,该第二目标属性子值为第三预设值,且该第二预设值大于该第三预设值;
根据该第二类型信息,确定第三目标属性子值,其中,当该第二类型信息指示该目标用户账号是主播账号时,该第三目标属性子值为第四预设值,当该第二类型信息指示该目标用户账号不是主播账号时,该第三目标属性子值为第五预设值,且该第四预设值大于该第五预设值;
将该第一目标属性子值、第二目标属性子值和第三目标属性子值进行相加,得到该目标属性值。
可选地,该第三确定模块404用于:
根据该目标属性值,以及该每个直播间的内容属性值和直播热度,通过以下公式确定该每个直播间的权重值:
N=(T+Z)*J
其中,N为该每个直播间的权重值,T为该目标属性值,Z为该每个直播间的内容属性值,J为该每个直播间的直播热度。
可选地,该装置还包括:
第五确定模块,用于根据该每个直播间的直播观看信息,确定该每个直播间的防刷修正值,该防刷修正值用于限制直播间的曝光量;
该第三确定模块404具体用于:
根据该每个直播间的内容属性值、直播热度和防刷修正值,确定该每个直播间的权重值。
可选地,该直播观看信息包括实时在线人数,该第五确定模块具体用于:
根据该每个直播间的实时在线人数,通过以下公式确定该每个直播间的防刷修正值:
Figure BDA0001876272720000291
其中,F为该每个直播间的防刷修正值,p为该每个直播间的实时在线人数。
可选地,该第三确定模块404具体用于:
根据该每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定该每个直播间的权重值:
N=Z*J*F
其中,N为该每个直播间的权重值,Z为该每个直播间的内容属性值,J为该每个直播间的直播热度,F为该每个直播间的防刷修正值。
可选地,该装置还包括:
第二获取模块,用于获取目标用户账号的目标信息,该目标信息至少包括观看直播的信息;
第四确定模块,用于根据该目标信息,确定目标属性值,该目标属性值用于表征该目标用户账号浏览推荐直播的概率;
第五确定模块,用于根据该每个直播间的直播观看信息,确定该每个直播间的防刷修正值,该防刷修正值用于限制直播间的曝光量;
该第三确定模块404具体用于:
根据该目标属性值,以及该每个直播间的内容属性值、直播热度和防刷修正值,确定该每个直播间的权重值。
可选地,该第三确定模块具体用于:
根据该目标属性值,以及该每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定该每个直播间的权重值:
N=(T+Z)*J*F
其中,N为该每个直播间的权重值,T为该目标属性值,Z为该每个直播间的内容属性值,J为该每个直播间的直播热度,F为该每个直播间的防刷修正值。
可选地,该排序模块具体用于:
根据该多个直播间的权重值,按照权重值从大到小的顺序,对该多个直播间进行排序。
可选地,该装置还包括:
选择模块,用于从排序后的该多个直播间中,选择前预设数目个直播间;
推荐模块,用于将选择的直播间推荐给目标用户账号。
本申请实施例中,可以根据多个直播间中每个直播间的直播内容信息和直播观看信息,分别确定每个直播间的内容属性值和直播热度,然后根据每个直播间的内容属性值和直播热度,确定每个直播间的权重值,根据多个直播间的权重值,对多个直播间进行排序。由于直播间的内容属性值用于表征直播内容中包含目标直播内容的概率,能够反映直播内容的优质程度,因此,本申请可以综合根据直播内容的优质程度和直播热度对直播间进行排序,从而能够将内容优质和/或热度较高的直播间优先展示给用户,相对于根据用户的浏览习惯对直播间进行排序的方案,避免了向用户优先展示的都是用户习惯浏览的直播间、缺乏新颖性的问题,能够向用户展示更加丰富多样的直播,提高了用户的浏览兴趣,进而提高了用户粘度。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种数据处理装置500的框图。例如,装置500可以被提供为一服务器。参照图5,装置500包括处理组件522,其进一步包括一个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执行的指令,例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件522被配置为执行指令,以执行上述数据处理方法。
装置500还可以包括一个电源组件526被配置为执行装置500的电源管理,一个有线或无线网络接口550被配置为将装置500连接到网络,和一个输入输出(I/O)接口558。装置500可以操作基于存储在存储器532的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在另一实施例中,还提供了一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算机的处理器执行时,使得计算机能够执行上述数据处理方法。
在另一实施例中,还提供了一种计算机程序产品,当其在计算机上运行时,使得计算机执行上述数据处理方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (20)

1.一种数据处理方法,其特征在于,所述方法包括:
获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
根据所述多个直播间的权重值,对所述多个直播间进行排序;
所述直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长;
所述根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,包括:
根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定所述每个直播间的第一内容属性子值;
根据所述每个直播间的第一内容属性子值,确定所述每个直播间的内容属性值。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定所述每个直播间的第一内容属性子值,包括:
根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,通过以下公式确定所述每个直播间的第一内容属性子值:
Figure FDA0002942464160000021
其中,turnover为所述每个直播间的第一内容属性子值,m和n分别是所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,k和l分别为所述每个直播间在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,y为第一常数。
3.根据权利要求1所述的方法,其特征在于,所述直播内容信息还包括第一直播总数和第二直播总数,所述第一直播总数是指在距当前时间之前的第二预设时长内进行的包含目标直播内容的直播的总数,所述第二直播总数是指在距当前时间之前的第二预设时长内进行的所有直播的总数;
所述根据所述每个直播间的第一内容属性子值,确定所述每个直播间的内容属性值,包括:
确定所述每个直播间的第一直播总数和第二直播总数的比值,将所述比值与第二常数的乘积作为所述每个直播间的第二内容属性子值;
将所述每个直播间的第一内容属性子值、第二内容属性子值和第一预设值进行相加,得到所述每个直播间的内容属性值。
4.根据权利要求1所述的方法,其特征在于,所述直播观看信息包括在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数;
所述根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度,包括:
根据所述每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,以及正在进行的目标直播的直播时长和观看总人数,通过以下公式确定所述每个直播间的直播热度:
Figure FDA0002942464160000022
其中,J为所述每个直播间的直播热度,c和g分别为所述每个直播间在距当前时间之前的第三预设时长内进行的所有直播的平均时长和平均在线人数,d和h分别为所述每个直播间正在进行的目标直播的直播时长和观看总人数,w为第三常数,q为第四常数。
5.根据权利要求1-4任一所述的方法,其特征在于,所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
将所述每个直播间的内容属性值和直播热度进行相乘,得到所述每个直播间的权重值。
6.根据权利要求1所述的方法,其特征在于,根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值之前,还包括:
获取目标用户账号的目标信息,所述目标信息至少包括观看直播的信息;
根据所述目标信息,确定目标属性值,所述目标属性值用于表征所述目标用户账号浏览推荐直播的概率;
所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值。
7.根据权利要求6所述的方法,其特征在于,所述目标信息包括在距当前时间之前的第四预设时长内观看所有直播的第一总时长和观看推荐直播的第二总时长;
所述根据所述目标信息,确定目标属性值,包括:
根据所述第一总时长和所述第二总时长,确定第一目标属性子值;
根据所述第一目标属性子值,确定所述目标属性值。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一总时长和所述第二总时长,确定第一目标属性子值,包括:
根据所述第一总时长和所述第二总时长,通过以下公式确定所述第一目标属性子值:
Figure FDA0002942464160000041
其中,recency为所述每个直播间的第一目标属性子值,a为所述第一总时长,b为所述第二总时长,x为第五常数。
9.根据权利要求7所述的方法,其特征在于,所述目标信息还包括第一类型信息和第二类型信息,所述第一类型信息用于指示所述目标用户账号是否为新注册用户账号,所述第二类型信息用于指示所述目标用户账号是否为主播账号;
所述根据所述第一目标属性子值,确定所述目标属性值,包括:
根据所述第一类型信息,确定第二目标属性子值,其中,当所述第一类型信息指示所述目标用户账号是新注册用户账号时,所述第二目标属性子值为第二预设值,当所述第一类型信息指示所述目标用户账号不是新注册用户账号时,所述第二目标属性子值为第三预设值,且所述第二预设值大于所述第三预设值;
根据所述第二类型信息,确定第三目标属性子值,其中,当所述第二类型信息指示所述目标用户账号是主播账号时,所述第三目标属性子值为第四预设值,当所述第二类型信息指示所述目标用户账号不是主播账号时,所述第三目标属性子值为第五预设值,且所述第四预设值大于所述第五预设值;
将所述第一目标属性子值、第二目标属性子值和第三目标属性子值进行相加,得到所述目标属性值。
10.根据权利要求6-9任一所述的方法,其特征在于,所述根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值和直播热度,通过以下公式确定所述每个直播间的权重值:
N=(T+Z)*J
其中,N为所述每个直播间的权重值,T为所述目标属性值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度。
11.根据权利要求1所述的方法,其特征在于,所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值之前,还包括:
根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,所述防刷修正值用于限制直播间的曝光量;
所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值。
12.根据权利要求11所述的方法,其特征在于,所述直播观看信息包括实时在线人数,所述根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,包括:
根据所述每个直播间的实时在线人数,通过以下公式确定所述每个直播间的防刷修正值:
Figure FDA0002942464160000051
其中,F为所述每个直播间的防刷修正值,p为所述每个直播间的实时在线人数。
13.根据权利要求11或12所述的方法,其特征在于,所述根据所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值,包括:
根据所述每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定所述每个直播间的权重值:
N=Z*J*F
其中,N为所述每个直播间的权重值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度,F为所述每个直播间的防刷修正值。
14.根据权利要求1所述的方法,其特征在于,所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值之前,还包括:
获取目标用户账号的目标信息,所述目标信息至少包括观看直播的信息;
根据所述目标信息,确定目标属性值,所述目标属性值用于表征所述目标用户账号浏览推荐直播的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的防刷修正值,所述防刷修正值用于限制直播间的曝光量;
所述根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值。
15.根据权利要求14所述的方法,其特征在于,所述根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,确定所述每个直播间的权重值,包括:
根据所述目标属性值,以及所述每个直播间的内容属性值、直播热度和防刷修正值,通过以下公式确定所述每个直播间的权重值:
N=(T+Z)*J*F
其中,N为所述每个直播间的权重值,T为所述目标属性值,Z为所述每个直播间的内容属性值,J为所述每个直播间的直播热度,F为所述每个直播间的防刷修正值。
16.根据权利要求1所述的方法,其特征在于,所述根据所述多个直播间的权重值,对所述多个直播间进行排序,包括:
根据所述多个直播间的权重值,按照权重值从大到小的顺序,对所述多个直播间进行排序。
17.根据权利要求16所述的方法,其特征在于,所述根据所述多个直播间的权重值,按照权重值从大到小的顺序,对所述多个直播间进行排序之后,还包括:
从排序后的所述多个直播间中,选择前预设数目个直播间;
将选择的直播间推荐给目标用户账号。
18.一种数据处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
第一确定模块,用于对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;第二确定模块,用于根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
第三确定模块,用于根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
排序模块,用于根据所述多个直播间的权重值,对所述多个直播间进行排序;
所述直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长;
所述第一确定模块具体用于:根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定所述每个直播间的第一内容属性子值;根据所述每个直播间的第一内容属性子值,确定所述每个直播间的内容属性值。
19.一种服务器,其特征在于,所述服务器包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取待排序的多个直播间中每个直播间的直播内容信息和直播观看信息;
对于所述多个直播间中的每个直播间,根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,所述内容属性值用于表征直播内容中包含目标直播内容的概率;
根据所述每个直播间的直播观看信息,确定所述每个直播间的直播热度;
根据所述每个直播间的内容属性值和直播热度,确定所述每个直播间的权重值;
根据所述多个直播间的权重值,对所述多个直播间进行排序;
所述直播内容信息包括正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长;
所述根据所述每个直播间的直播内容信息,确定所述每个直播间的内容属性值,包括:
根据所述每个直播间正在进行的目标直播中包含目标直播内容的直播时长和所述目标直播已直播的时长,以及在距当前时间之前的第一预设时长内进行的所有直播中包含目标直播内容的最长直播时长和最短直播时长,确定所述每个直播间的第一内容属性子值;
根据所述每个直播间的第一内容属性子值,确定所述每个直播间的内容属性值。
20.一种非临时性计算机可读存储介质,当所述存储介质中的指令由计算机的处理器执行时,使得所述计算机能够执行上述权利要求1-17任一所述的数据处理方法。
CN201811400867.0A 2018-11-22 2018-11-22 数据处理方法、装置、服务器及存储介质 Active CN109547808B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811400867.0A CN109547808B (zh) 2018-11-22 2018-11-22 数据处理方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811400867.0A CN109547808B (zh) 2018-11-22 2018-11-22 数据处理方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN109547808A CN109547808A (zh) 2019-03-29
CN109547808B true CN109547808B (zh) 2021-04-20

Family

ID=65849921

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811400867.0A Active CN109547808B (zh) 2018-11-22 2018-11-22 数据处理方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN109547808B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110225361B (zh) * 2019-06-03 2021-10-15 武汉瓯越网视有限公司 直播间推荐方法、存储介质、电子设备及系统
CN112565797B (zh) * 2019-09-10 2022-08-05 北京达佳互联信息技术有限公司 一种页面请求处理方法、装置、电子设备及介质
CN111866545A (zh) * 2019-12-08 2020-10-30 李萍 基于权重分析的搜索优先级排序装置
CN111031339A (zh) * 2019-12-18 2020-04-17 网易(杭州)网络有限公司 直播视频处理的方法及装置
CN112019890B (zh) * 2020-10-28 2021-02-09 北京达佳互联信息技术有限公司 直播分发方法、装置、服务器及介质
CN112492334B (zh) * 2020-11-17 2023-06-20 北京达佳互联信息技术有限公司 一种直播视频推送方法和装置及设备
CN113312512B (zh) * 2021-06-10 2023-10-31 北京百度网讯科技有限公司 训练方法、推荐方法、装置、电子设备以及存储介质
CN113365095B (zh) * 2021-06-15 2023-03-03 北京百度网讯科技有限公司 直播资源推荐方法、装置、电子设备以及存储介质
CN113590955A (zh) * 2021-07-30 2021-11-02 武汉斗鱼鱼乐网络科技有限公司 目标推荐用户确定方法、装置、电子设备以及存储介质
CN113891102B (zh) * 2021-08-18 2023-09-19 北京达佳互联信息技术有限公司 直播间处理方法、装置、服务器及存储介质
CN113869661A (zh) * 2021-09-06 2021-12-31 贵阳语玩科技有限公司 一种聊天室实时推荐方法、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631823A (zh) * 2012-08-28 2014-03-12 腾讯科技(深圳)有限公司 一种媒体内容推荐方法及设备
CN105792006A (zh) * 2016-03-04 2016-07-20 广州酷狗计算机科技有限公司 互动信息显示方法及装置
CN106682111A (zh) * 2016-12-06 2017-05-17 腾讯科技(深圳)有限公司 一种数据推荐方法及其设备
CN107205178A (zh) * 2017-04-25 2017-09-26 北京潘达互娱科技有限公司 直播间推荐方法及装置
CN108769823A (zh) * 2018-05-28 2018-11-06 广州虎牙信息科技有限公司 直播间显示方法、装置、设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8584166B2 (en) * 2011-05-11 2013-11-12 Verizon Patent And Licensing Inc. Probabilistic-based content recommender

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631823A (zh) * 2012-08-28 2014-03-12 腾讯科技(深圳)有限公司 一种媒体内容推荐方法及设备
CN105792006A (zh) * 2016-03-04 2016-07-20 广州酷狗计算机科技有限公司 互动信息显示方法及装置
CN106682111A (zh) * 2016-12-06 2017-05-17 腾讯科技(深圳)有限公司 一种数据推荐方法及其设备
CN107205178A (zh) * 2017-04-25 2017-09-26 北京潘达互娱科技有限公司 直播间推荐方法及装置
CN108769823A (zh) * 2018-05-28 2018-11-06 广州虎牙信息科技有限公司 直播间显示方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN109547808A (zh) 2019-03-29

Similar Documents

Publication Publication Date Title
CN109547808B (zh) 数据处理方法、装置、服务器及存储介质
CN109241425B (zh) 一种资源推荐方法、装置、设备及存储介质
CN109769128B (zh) 视频推荐方法、视频推荐装置和计算机可读存储介质
CN107666615B (zh) 潜力主播用户的挖掘方法、装置及服务器
CN110366043B (zh) 视频处理方法、装置、电子设备及可读介质
CN107465936A (zh) 一种直播列表镜像展示方法、直播平台服务器及客户端
CN108900923A (zh) 推荐直播模板的方法和装置
CN112511856B (zh) 虚拟资源推送方法、装置及服务器
US11388561B2 (en) Providing a summary of media content to a communication device
CN113535991A (zh) 一种多媒体资源推荐方法、装置、电子设备及存储介质
CN111107434A (zh) 信息推荐方法及装置
CN112511849A (zh) 一种游戏显示方法、装置、设备、系统及存储介质
CN111800647A (zh) 直播连麦匹配方法、装置、设备及存储介质
CN117255211A (zh) 直播间显示方法、服务端及直播客户端
KR101708254B1 (ko) 협업적 필터링과 캐릭터 넷을 이용한 스토리 기반의 영화 추전 시스템 및 방법.
CN109462765A (zh) 一种推荐页面下发和显示方法及装置
CN109688217B (zh) 一种消息推送方法、装置及电子设备
CN112463856A (zh) 一种基于实时虚拟互动的性格特征分析方法、装置及终端设备
CN112784070A (zh) 一种基于大数据的用户画像方法
CN109327736B (zh) 一种基于节目观看表情与用户信息的节目推荐方法
CN111629236B (zh) 好友关系建立方法、装置、设备以及计算机可读存储介质
CN113709507A (zh) 一种视频推荐方法、装置、电子设备及存储介质
CN114040214A (zh) 一种直播间推荐方法、装置、电子设备和存储介质
CN114969493A (zh) 一种内容推荐方法和相关装置
CN114554253B (zh) 一种资源推荐方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant