CN110147481A - 媒体内容推送方法、装置及存储介质 - Google Patents

媒体内容推送方法、装置及存储介质 Download PDF

Info

Publication number
CN110147481A
CN110147481A CN201710734804.8A CN201710734804A CN110147481A CN 110147481 A CN110147481 A CN 110147481A CN 201710734804 A CN201710734804 A CN 201710734804A CN 110147481 A CN110147481 A CN 110147481A
Authority
CN
China
Prior art keywords
interest
category
degree
user
media content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710734804.8A
Other languages
English (en)
Other versions
CN110147481B (zh
Inventor
庄凯
胡博
何翔
郭卫敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Beijing Co Ltd
Original Assignee
Tencent Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Beijing Co Ltd filed Critical Tencent Technology Beijing Co Ltd
Priority to CN201710734804.8A priority Critical patent/CN110147481B/zh
Publication of CN110147481A publication Critical patent/CN110147481A/zh
Application granted granted Critical
Publication of CN110147481B publication Critical patent/CN110147481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种媒体内容推送方法、装置及存储介质,该方法包括:当接收到应用客户端的页面数据获取请求时,从用户数据库获取所述页面数据获取请求携带的用户标识对应的用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度;对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度;根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。

Description

媒体内容推送方法、装置及存储介质
技术领域
本申请涉及互联网技术领域,尤其涉及一种媒体内容推送方法、装置及存储介质。
背景技术
随着互联网技术的发展,越来越多的数据(包括:文本、图片、音频、视频等)会通过互联网推送给各种用户。为了针对每个用户的兴趣特点,给每个用户推送个性化的数据,目前有利用用户画像(profile)技术来为每个用户推荐个性化的数据。所谓用户画像技术,通过用户的历史数据建立描绘该用户的标签,比如,用户对体育和财经类的资讯比较感兴趣,用户画像技术得出该用户的标签为体育和财经。向用户推荐数据的推荐系统通过用户画像技术得到用户的标签后,向用户推荐上述标签相关的数据,如向用户推荐体育和财经类的资讯。
发明内容
本申请提供了一种媒体内容推送方法,该方法包括:当接收到应用客户端的页面数据获取请求时,从用户数据库获取所述页面数据获取请求携带的用户标识对应的用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度;对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度;根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。
本申请还提供一种媒体内容推送装置,该装置包括:获取模块,当接收到应用客户端的页面数据获取请求时,从用户数据库获取所述页面数据获取请求携带的用户标识对应的用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度;处理模块,对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度;选择模块,根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。
本申请实例提供了一种计算机可读存储介质,存储有计算机可读指令,可以使至少一个处理器执行上述方法。
采用上述技术方案,能够丰富向用户推送的媒体内容,改善了媒体内容推送的效果。
附图说明
为了更清楚地说明本申请实例中的技术方案,下面将对实例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请涉及的一种系统构架示意图;
图2为本申请一实例的方法流程图;
图3(a)~(b)是本申请涉及的采样输出分布图;
图4为本申请一媒体内容推送实例的消息交互图;
图5是本申请一实例的装置结构图;及
图6是本申请一实例的设备结构图。
具体实施方式
下面将结合本申请实例中的附图,对本申请实例中的技术方案进行清楚、完整地描述,显然,所描述的实例仅是本申请一部分实例,而不是全部的实例。基于本申请中的实例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实例,都属于本申请保护的范围。
在一些实例中,一些类别的推荐系统,如新闻资讯类的推荐系统,通常会对媒体内容(如文章)进行分类,针对分类维度(如体育、娱乐及财经等)捕获用户兴趣从而向用户推荐其兴趣度较高的维度下的媒体内容。常见的兴趣推荐主要依据用户分类兴趣模型得分(或称为用户画像技术),该用户分类兴趣模型得分可以是这样一个方式:根据推荐系统向用户X历史推荐的各类别的媒体内容的点击数/展现数的比值(或称点击率),得到该用户X的用户画像,用户画像可以是种多维度的数据结构,其包括多个用户兴趣维度(或者说兴趣类别或兴趣标签)上的兴趣度得分。如推荐系统曾向用户X推送体育类资讯10次(或者称为体育类资讯展现数为10),用户X对上述体育类资讯点击9次(或者称为体育类资讯点击数或有效阅读数为9),则对用户X而言,体育类资讯的点击数/展现数的比值为0.9,即体育类资讯得分为0.9,对其他类别依此类推,上述几个得分靠前的类别为用户X的标签,即可得到包括这几个得分靠前的类别的得分的用户X的用户画像。之后,推荐系统向用户X推荐与该用户X标签匹配的资讯,例如,通过用户画像技术得出用户X的标签有体育、娱乐和财经,则推荐系统向用户X推荐体育、娱乐和财经类别下的资讯。
然而,上述用户分类兴趣模型得分会使得得分靠前的分类的媒体内容容易占据所有推荐槽位,极端情况下部分用户只能看到得分最靠前的少量分类内容,这样由于展现分类的减少,用户可选择的内容越发集中,推荐类别密集的问题会越来越严重。例如,通过用户画像技术得出用户X的标签有A分类和B分类,且A分类得分为0.9,B分类得分为0.1,则推荐系统向用户X推荐A分类和B分类的媒体内容,根据A分类和B分类的得分,该推荐方法会使用户X大量看到A分类的媒体内容,且推荐系统每次给用户X推荐媒体内容之前,都会对用户X的历史数据(如推送给该用户X的各个类别媒体内容的展示数、点击数及点击数/展现数的比值)采用上述用户分类兴趣模型得分进行计算,若推荐系统长期大量推荐A分类,则最终会使得A分类的得分趋于1,推荐列表完全集中到了A分类,用户X几乎看不到B分类的媒体内容,且这种情形长期无法缓解。这种推荐中心化(指用户画像技术得到的用户标签的集中化)的方案虽然能对推荐效果带来不错的收益,但是长期的中心化会导致推荐系统过于密集的推荐某一分类的媒体内容,为用户推荐的内容涉及的分类过少。一种处理方案是在推荐系统的推荐内容结果中随机的增加少量其他分类的媒体内容,以进行去中心化。例如,通过用户画像技术得出用户X的标签为体育和财经,该处理方案则在推荐系统的推荐内容结果中直接添加娱乐分类的媒体内容,该处理方案过于粗暴,不够灵活。
上述实例存在的问题又可以称为开发-勘探(Exploitation-Exploration,EE)问题,即如何在利用用户的兴趣向用户推荐其感兴趣的媒体内容的同时,不断开发探索用户新的兴趣,以避免反复给用户推送同类别的或是相似甚至相同的媒体内容。
为了解决上述技术问题,本申请提出一种媒体内容推送方法,该方法应用于图1所示的系统构架中。如图1所示,该系统构架包括:应用客户端101、应用服务器102、媒体内容推荐系统103和数据库104,其中,媒体内容推荐系统103可位于应用服务器102的内部或者外部,数据库104可以位于媒体内容推荐系统103的内部或者外部,可以是用户画像数据库。应用客户端101、应用服务器102、媒体内容推荐系统103和数据库104通过互联网105进行通信。
用户可以使用应用客户端101(如快报APP客户端等)访问应用服务器102,比如:浏览新闻资讯等,应用服务器102可以是提供各种互联网服务的网站服务器,比如:门户网站服务器、快报或今日头条等的新闻服务器、提供在线视频/音频播放服务的服务器、社交平台的服务器等等。
当用户使用应用客户端101访问应用服务器102时,如用户使用终端设备打开应用客户端101或者切换应用客户端101的页面时,向应用服务器102发送针对应用客户端101首页或欲切换到页面的页面数据获取请求,其中,所述页面数据获取请求携带用户标识,应用服务器102内部的或者与其连接的媒体内容推荐系统103响应上述页面数据获取请求,根据用户标识从数据库104获取用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度,所述第一兴趣度可以为通过用户画像技术得到的各兴趣类别的第一得分。媒体内容推荐系统103可以为向用户进行个性化推送媒体内容的推荐系统,如新闻资讯类的推荐系统、视频类的推荐系统等。
之后,媒体内容推荐系统103对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度;及根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。媒体内容推荐系统103将所述准备推送给所述应用客户端的媒体内容发送给应用服务器102,应用服务器102将所述准备推送给所述应用客户端的媒体内容携带在页面数据获取响应(对应于上述页面数据获取请求)中并将其发送给应用客户端101,以使应用客户端101根据此页面数据展示一页面并在此页面中展示所述媒体内容。
在一些实例中,本申请提出一种媒体内容推送方法,该方法应用于上述媒体内容推荐系统103,如图2所示,该方法包括以下步骤:
步骤201:当接收到应用客户端的页面数据获取请求时,从用户数据库获取所述页面数据获取请求携带的用户标识对应的用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度。
这里,媒体内容推荐系统103从数据库104获得用户兴趣数据,该数据库可以位于媒体内容推荐系统103的内部或者外部,以及可以位于应用客户端101对应的应用服务器102的内部或者外部,媒体内容推荐系统103位于应用服务器102的内部或与应用服务器102连接。
其中,所述第一兴趣度可以为各兴趣类别的得分,且该得分通过用户画像技术获得,例如,媒体内容推荐系统103从数据库104中获取存储的用户兴趣数据,用户兴趣数据可以包括各个兴趣维度上的兴趣度得分,其可通过以下方式得到:媒体内容推荐系统曾向用户X推送体育类媒体内容100次(或者称为体育类媒体内容展现数为100),用户X对上述体育类媒体内容点击90次(或者称为体育类媒体内容点击数或有效阅读数为90),则对用户X而言,体育类媒体内容的点击数/展现数的比值为0.9,即体育类媒体内容得分为0.9;媒体内容推荐系统曾向用户X推送娱乐类媒体内容100次,用户X对上述娱乐类媒体内容点击5次,则娱乐类媒体内容得分为0.05;同样,媒体内容推荐系统曾向用户X推送财经类媒体内容100次,用户X对上述财经类媒体内容点击5次,则财经类媒体内容得分为0.05。
在一些实例中,所述用户兴趣数据进一步包括所述至少一个兴趣类别各自的第三兴趣度,所述第三兴趣度表征全局用户对于所述兴趣类别的兴趣度;在进行所述概率分布采样处理之前,所述方法进一步包括:针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一兴趣度进行调整;其中,对所述调整后的第一兴趣度进行概率分布采样处理。
在一些实例中,所述根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一兴趣度进行调整,包括:将所述至少一个兴趣类别中每一个兴趣类别的所述第一兴趣度偏移一定数值,以使所述第一兴趣度远离所述第三兴趣度。其中,针对不同的兴趣类别,偏移的数值可以不同也可以相同。具体的,可根据第一兴趣度与第三兴趣度来确定要偏移的数值,比如根据二者的差值来确定要偏移的数值,也可以预先设定要偏移的数值。
例如,媒体内容推荐系统103从数据库104获取所述用户标识对应的用户兴趣数据还包括表征全局用户对于至少一个兴趣类别各自兴趣度的第三兴趣度,即用户X的体育类媒体内容得分为0.6,全局用户的体育类媒体内容得分为0.4,根据上述得分可知,用户X对于体育类媒体内容较全局用户更加喜欢,媒体内容系统103会对用户X的体育类媒体内容得分稍微加强,将所述体育类媒体内容得分偏移预定数值,所述预定数值可以按以下公式(1)取得,假设用户X的体育类媒体内容得分为A,全局用户的体育类媒体内容得分为B,则
其中,C取经验值,例如100或1000,通过调节C的取值,可以调节A’的调整幅度;A’为根据全局用户的对应类媒体内容得分调整后的用户X的某类媒体内容得分,以使其远离全局用户的得分(即第三兴趣度)的影响。例如,当用户X的体育类媒体内容得分为0.6,即A=0.6,全局用户的体育类媒体内容得分为0.4,即B=0.4,此时,A>B,A’=A*min(1+log(A/B)/logC,2),可取C=100,A’=0.65,将用户X的体育类媒体内容得分远离了全局用户的得分的影响。此外,还可以通过给对数项中的A、B均增加一偏差,使得A’的调整幅度更加平滑,此时,公式(1)变成如下所示的公式(2)
其中,Δt取经验值。
步骤202:对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度。在一些实例中,其中,对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,包括:将所述第一兴趣度转换成预定概率分布函数的第一输入参数和第二输入参数;根据所述第一输入参数和所述第二输入参数及所述概率分布函数,确定所述第二兴趣度。
例如,所述预定概率分布函数为EE问题中Thompson采样算法具体采用的Beta概率分布函数,当然还可以为其他概率分布函数,如威尔逊区间算法,本申请对此不限定。媒体内容推荐系统103将上述各兴趣类别的得分转换成Beta概率分布函数的第一输入参数和第二输入参数,如将体育类媒体内容得分0.9=90/100,则体育类媒体内容的Beta概率分布函数的第一输入参数α=90,第二输入参数β=10(即100-90);如娱乐类媒体内容得分0.05=5/100,则娱乐类媒体内容的Beta概率分布函数的第一输入参数α=5,第二输入参数β=95(即100-5)。
Beta概率分布函数基于任一个兴趣类别得分转换的上述第一输入参数和第二输入参数均输出一个随机数b(即第二兴趣度),其中,b的取值范围为0~1。如体育类媒体内容的Beta概率分布函数如图3(a)所示,从图3(a)可以看出,媒体内容推荐系统向所述用户推送体育类媒体内容的概率(即Beta概率分布函数输出的一个随机数)在0~1之间,通过采用Beta概率分布函数进行采样,使得媒体内容推荐系统每次在线向该用户推送体育类媒体内容的概率不会一直是0.9(不采用Beta概率分布函数进行采样时,则媒体内容推荐系统向该用户推送体育类媒体内容的概率会一直是0.9),而是在0~1之间取值,且所述媒体内容推荐系统每次在线向该用户推送体育类媒体内容的概率主要集中在0.76~1.0,从图3(a)所示的概率分布函数的纵坐标可以看出,其峰值位于横坐标x=0.9处,且横坐标x=0.9附近的横坐标取值(即0.76~1.0)对应的纵坐标取值也较大,即所述媒体内容推送系统选择体育类的媒体内容的概率主要在0.76~1.0,也就是所述媒体内容推送系统会主要选择体育类的媒体内容。采用上述技术方案,使得体育类媒体内容被推荐的概率稍微降低,减轻体育类媒体内容的推荐集中化程度。
同样,娱乐类媒体内容的Beta概率分布函数如图3(b)所示,从图3(b)可以看出,媒体内容推荐系统选择娱乐类媒体内容的概率主要在0~0.15之间,从图3(b)所示的概率分布函数的纵坐标可以看出,其峰值位于横坐标x=0.05处,且横坐标x=0.05附近的横坐标取值(即0~0.15)对应的纵坐标取值也较大,即所述媒体内容推送系统选择娱乐类的媒体内容的概率主要在0~0.15,通过采用Beta概率分布函数进行采样,使得媒体内容推荐系统每次在线向该用户推送娱乐类媒体内容的概率不会一直是0.05,而是在0~1之间取值,且主要集中在0~0.15取值,使得娱乐类媒体内容被推荐的概率稍有提升,增加媒体内容推荐系统向该用户推送娱乐类媒体内容的概率。
综合图3(a)和图3(b)可知,媒体内容推荐系统推送体育类媒体内容的概率集中在0.9附近,媒体内容推荐系统推送娱乐类媒体内容的概率集中在0.05附近,即媒体内容推荐系统主要向所述用户推送体育类媒体内容,然而由于体育类媒体内容和娱乐类媒体内容Beta概率分布函数的采样值输出,使得媒体内容推荐系统推送体育类媒体内容的概率可能为0.76,推送娱乐类媒体内容的概率可能为0.15,即推送体育类媒体内容被推荐的概率稍微降低(即推送体育类媒体内容被推荐的概率主要集中在0.76~1.0之间取值,也会小概率的在0~0.76之间取值),推送娱乐类媒体内容被推荐的概率稍有提高(即推送娱乐类媒体内容的概率主要集中在0~0.15之间取值,也会小概率的在0.15~1之间取值),从而使得媒体内容推荐系统在主要向某个用户推送体育类媒体内容的同时,也会向该用户推送娱乐类媒体内容,从而丰富了向该用户推送的媒体内容。
在一些实例中,在将所述第一兴趣度转换成所述第一输入参数和所述第二输入参数之后,所述方法进一步包括:针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一输入参数和所述第二数据参数进行调整;其中,根据所述调整后的第一输入参数和所述调整后的第二输入参数及所述概率分布函数,确定所述第二兴趣度。
根据全局用户对某一兴趣类别的兴趣度对Beta概率分布函数的第一输入参数和第二输入参数进行调整,特别是用户数据库中某个用户某个类别媒体内容的在线表现统计数据(包括该类别媒体内容的展现数和点击数)不够,即针对上述数据进行概率分布采样处理得到的结果置信度不够时,可以根据全局用户的全部或部分兴趣类别媒体内容的在线表现统计数据(如媒体内容总数和展现数(或曝光量)等),使用偏移(bias)参数对该用户该类别媒体内容的在线表现统计数据进行调整,以提高针对上述数据进行计算得到结果的置信度。其中,所述bias参数为经验取值,与具体的在线表现统计数据集有关。随着用户数据库中某个用户某个类别媒体内容的统计数据越来越多,媒体内容推荐系统每一次向该用户在线推荐该类别媒体内容前(初始时使用的bias参数和之后每一次使用的bias参数均相同),使用bias参数对Beta概率分布函数的第一输入参数和第二输入参数进行调整,对概率分布采样处理得到的结果的影响越来越小。
例如,初始时,用户数据库中用户Y的体育类文章的统计数据不够,如体育类资讯展现数为3,点击数为1,即第一输入参数α=1,第二输入参数β=2,为了提高上述初始值(即α=1,β=2)的置信度,此时可以设置bias=0.5,使得调整后的第一输入参数α’=1+0.5=1.5,第二输入参数β’=2+0.5=2.5,则Beta概率分布函数的期望为削弱了初始值对Beta概率分布函数的影响,且随着用户数据库中用户Y的体育类文章的统计数据增加,使用bias参数调整对Beta概率分布函数的影响越来越小,使得对用户Y的体育类文章的统计数据进行Beta概率分布采样处理的结果越来越接近真实情况。
针对不同类别的媒体内容还可以设置不同的bias参数对该类别媒体内容的Beta概率分布函数进行调整,上述不同的bias参数的选择可以根据全局用户的全部或部分兴趣类别媒体内容的在线表现统计数据(如媒体内容总数和展现数(或曝光量)等)来选择,例如全局用户的美女类文章共有10000篇,体育类文章共有100篇,即体育类相对于美女类属于小众类,从而体育类文章的点击率(或体育类文章的点击数)比较重要,此时可以设置体育类文章的bias小于美女类文章的bias,使得体育类文章的点击率更敏感。
步骤203:根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。
这里,各兴趣类别及其对应的第二兴趣度构成了调整后的用户画像,所述媒体内容推荐系统根据调整后的用户画像选择准备推送给所述应用客户端的媒体内容。
在一些实例中,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别包括:将达到预定阈值的所述至少一个兴趣类别各自的所述第二兴趣度确定为符合预定条件的兴趣类别。
在一些实例中,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别包括:对所述至少一个兴趣类别各自的所述第二兴趣度进行降序排序,将所述第二兴趣度排序靠前的一个或多个兴趣类别确定为符合预定条件的兴趣类别。
在一些实例中,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,包括:对所述至少一个兴趣类别各自的所述第二兴趣度进行归一化处理,得到所述至少一个兴趣类别各自的第三兴趣度;从所述至少一个兴趣类别中确定其第三兴趣度符合预定条件的兴趣类别。
例如,采用Beta概率分布函数得到的采样输出,体育类媒体内容的概率为0.01,娱乐类媒体内容的概率为0.02,将上述两个概率值进行归一化,该用户的体育类媒体内容得分为该用户的娱乐类媒体内容得分为以防止媒体内容推荐系统的过滤模块将得分较低的类别的媒体内容过滤掉。例如,所述过滤模块设置将得分低于0.05的类别的媒体内容过滤掉,这种情形下,如果不做归一化处理,所述过滤模块会将所述用户的上述两种媒体内容均过滤掉,从而媒体内容推荐系统无法根据该用户的画像向该用户推送媒体内容。
通过上述技术方案,可以在保证媒体内容推荐系统主要推送第一兴趣度较高的媒体内容的前提下,使得媒体内容推荐系统推送第一兴趣度较高的媒体内容的概率稍微降低,推送第一兴趣度较低的媒体内容的概率稍微升高,从而增加第一兴趣度较低的媒体内容的推荐几率,减轻媒体内容推荐系统对于第一兴趣度较高的某个类别媒体内容的推荐过于密集的问题,使得媒体内容推荐系统推送的内容类别更加多样,内容更加丰富,提高用户对于在线内容的多样性体验,并改善了系统的内容推送效果,使得各种类别的内容在网络中得到了更广泛的传播。
图4示出了本申请提出的一种媒体内容推送方法的交互图。在此实例中,应用服务器102包括媒体内容推荐系统103和数据库104,所述概率分布函数为EE问题中Thompson采样算法的Beta概率分布函数,如图4所示,媒体内容推送过程包括如下步骤:
步骤401:用户打开应用客户端或者切换应用客户端的页面,向应用服务器发送针对应用客户端首页或欲切换到页面的页面数据获取请求,其中,所述页面数据获取携带用户标识。
步骤402:应用服务器内部的媒体内容推荐系统响应上述页面数据获取请求,根据所述用户标识从应用服务器内部的数据库获取用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一得分,所述第一得分通过用户画像技术获得。
步骤403:媒体内容推荐系统将上述第一得分转换成Beta概率分布函数的第一输入参数和第二输入参数。
步骤404:媒体内容推荐系统根据上述第一输入参数和第二输入参数采用Beta概率分布函数进行采样,得到所述用户标识对应的至少一个兴趣类别各自的第二得分。
步骤405:媒体内容推荐系统对上述第二得分进行降序排序,将所述第二得分排序靠前的兴趣类别的媒体内容确定为准备推送给所述应用客户端的媒体内容。
步骤406:媒体内容推荐系统将所述准备推送给所述应用客户端的媒体内容发送给应用服务器,所述应用服务器所述准备推送的媒体内容发送给应用客户端。
步骤407:应用客户端展示所述媒体内容。
基于上述实例提供的方法,本申请还提出了一种数据处理装置500,如图5所示,所述装置500包括:
获取模块501,当接收到应用客户端的页面数据获取请求时,从用户数据库获取所述页面数据获取请求携带的用户标识对应的用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度。
处理模块502,对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度。
选择模块503,根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。
在一些实例中,所述第一用户兴趣数据进一步包括所述至少一个兴趣类别各自的第三兴趣度,所述第三兴趣度表征全局用户对于所述兴趣类别的兴趣度;所述装置500进一步包括:第一调整模块504,在进行所述概率分布采样处理之前,针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一兴趣度进行调整;其中,所述处理模块502对所述调整后的第一兴趣度进行概率分布采样处理。
在一些实例中,所述处理模块502对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,包括:将所述第一兴趣度转换成预定概率分布函数的第一输入参数和第二输入参数;根据所述第一输入参数和所述第二输入参数及所述概率分布函数,确定所述第二兴趣度。
在一些实例中,所述第一用户兴趣数据进一步包括所述至少一个兴趣类别各自的第三兴趣度,所述第三兴趣度表征全局用户对于所述兴趣类别的兴趣度;所述装置500进一步包括:第二调整模块505,在将所述第一兴趣度转换成所述第一输入参数和所述第二输入参数之后,针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一输入参数和所述第二数据参数进行调整;其中,所述处理模块502根据所述调整后的第一输入参数和所述调整后的第二输入参数及所述概率分布函数,确定所述第二兴趣度。
上述各模块功能的具体实现原理在前文已有描述,这里不再赘述。
另外,在本申请各个实例中的媒体内容推送方法和装置以及其中的各模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上装置或模块集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
在一实例中,上述的媒体内容推送装置可运行在各种可基于互联网而进行用户信息处理的计算设备中,并加载在该计算设备的存储器中。
图6示出了媒体内容推送装置所在的计算设备的组成结构图。如图6所示,该计算设备包括一个或者多个处理器(CPU)602、通信模块604、存储器606、用户接口610,以及用于互联这些组件的通信总线608。
处理器602可通过通信模块604接收和发送数据以实现网络通信和/或本地通信。
用户接口610包括一个或多个输出设备612,其包括一个或多个扬声器和/或一个或多个可视化显示器。用户接口610也包括一个或多个输入设备614,其包括诸如,键盘,鼠标,声音命令输入单元或扩音器,触屏显示器,触敏输入板,姿势捕获摄像机或其他输入按钮或控件等。
存储器606可以是高速随机存取存储器,诸如DRAM、SRAM、DDR RAM、或其他随机存取固态存储设备;或者非易失性存储器,诸如一个或多个磁盘存储设备、光盘存储设备、闪存设备,或其他非易失性固态存储设备。
存储器606存储处理器602可执行的指令集,包括:
操作系统616,包括用于处理各种基本系统服务和用于执行硬件相关任务的程序;
应用618,包括用于实现媒体内容推送的各种程序,这种程序能够实现上述各实例中的处理流程,比如可以包括图5所示的媒体内容推送装置500。
在一些实例中,媒体内容推送装置500可包括图5所示的各模块501~505,各模块501~505可以存储有机器可执行指令。处理器602通过执行存储器606中各模块501~505中的机器可执行指令,进而能够实现上述各模块501~505的功能。
另外,本申请的每一个实例可以通过由数据处理设备如计算机执行的数据处理程序来实现。显然,数据处理程序构成了本发明。此外,通常存储在一个存储介质中的数据处理程序通过直接将程序读取出存储介质或者通过将程序安装或复制到数据处理设备的存储设备(如硬盘和或内存)中执行。因此,这样的存储介质也构成了本发明。存储介质可以使用任何类型的记录方式,例如纸张存储介质(如纸带等)、磁存储介质(如软盘、硬盘、闪存等)、光存储介质(如CD-ROM等)、磁光存储介质(如MO等)等。
因此本申请还公开了一种非易失性存储介质,其中存储有数据处理程序,该数据处理程序用于执行本申请上述方法的任何一种实例。
另外,本申请所述的方法步骤除了可以用数据处理程序来实现,还可以由硬件来实现,例如,可以由逻辑门、开关、专用集成电路(ASIC)、可编程逻辑控制器和嵌微控制器等来实现。因此这种可以实现本申请所述方法的硬件也可以构成本申请。
以上所述仅为本申请的较佳实例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (12)

1.一种媒体内容推送方法,其特征在于,该方法包括:
当接收到应用客户端的页面数据获取请求时,从用户数据库获取所述页面数据获取请求携带的用户标识对应的用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度;
对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度;
根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。
2.根据权利要求1所述的方法,其中,所述用户兴趣数据进一步包括所述至少一个兴趣类别各自的第三兴趣度,所述第三兴趣度表征全局用户对于所述兴趣类别的兴趣度;
在进行所述概率分布采样处理之前,所述方法进一步包括:
针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一兴趣度进行调整;
其中,对所述调整后的第一兴趣度进行概率分布采样处理。
3.根据权利要求1所述的方法,其中,对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,包括:
将所述第一兴趣度转换成预定概率分布函数的第一输入参数和第二输入参数;
根据所述第一输入参数和所述第二输入参数及所述概率分布函数,确定所述第二兴趣度。
4.根据权利要求3所述的方法,其中,所述用户兴趣数据进一步包括所述至少一个兴趣类别各自的第三兴趣度,所述第三兴趣度表征全局用户对于所述兴趣类别的兴趣度;
在将所述第一兴趣度转换成所述第一输入参数和所述第二输入参数之后,所述方法进一步包括:
针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一输入参数和所述第二数据参数进行调整;
其中,根据所述调整后的第一输入参数和所述调整后的第二输入参数及所述概率分布函数,确定所述第二兴趣度。
5.根据权利要求1所述的方法,其中,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,包括:
对所述至少一个兴趣类别各自的所述第二兴趣度进行归一化处理,得到所述至少一个兴趣类别各自的第三兴趣度;
从所述至少一个兴趣类别中确定其第三兴趣度符合预定条件的兴趣类别。
6.根据权利要求1所述的方法,其中,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,包括:
当所述至少一个兴趣类别中的一个兴趣类别的所述第二兴趣度达到预定阈值时,确定该兴趣类别为符合预定条件的兴趣类别。
7.根据权利要求1所述的方法,其中,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,包括:
对所述至少一个兴趣类别各自的所述第二兴趣度进行降序排序;
将所述第二兴趣度排序靠前的一个或多个兴趣类别确定为符合预定条件的兴趣类别。
8.一种媒体内容推送装置,其特征在于,该装置包括:
获取模块,当接收到应用客户端的页面数据获取请求时,从用户数据库获取所述页面数据获取请求携带的用户标识对应的用户兴趣数据,其中,所述用户兴趣数据包括所述用户标识对应的至少一个兴趣类别各自的第一兴趣度,所述第一兴趣度表征所述用户标识对应的用户对于所述兴趣类别的兴趣度;
处理模块,对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,得到所述至少一个兴趣类别各自的第二兴趣度;
选择模块,根据所述至少一个兴趣类别各自的所述第二兴趣度,从所述至少一个兴趣类别中确定符合预定条件的兴趣类别,在所确定的兴趣类别下选择准备推送给所述应用客户端的媒体内容。
9.根据权利要求8所述的装置,其中,所述第一用户兴趣数据进一步包括所述至少一个兴趣类别各自的第三兴趣度,所述第三兴趣度表征全局用户对于所述兴趣类别的兴趣度;所述装置进一步包括:
第一调整模块,在进行所述概率分布采样处理之前,针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一兴趣度进行调整;
其中,所述处理模块对所述调整后的第一兴趣度进行概率分布采样处理。
10.根据权利要求8所述的装置,其中,所述处理模块对所述至少一个兴趣类别各自的第一兴趣度分别进行概率分布采样处理,包括:
将所述第一兴趣度转换成预定概率分布函数的第一输入参数和第二输入参数;
根据所述第一输入参数和所述第二输入参数及所述概率分布函数,确定所述第二兴趣度。
11.根据权利要求10所述的装置,其中,所述第一用户兴趣数据进一步包括所述至少一个兴趣类别各自的第三兴趣度,所述第三兴趣度表征全局用户对于所述兴趣类别的兴趣度;所述装置进一步包括:
第二调整模块,在将所述第一兴趣度转换成所述第一输入参数和所述第二输入参数之后,针对所述至少一个兴趣类别中的每一个兴趣类别,根据该兴趣类别的所述第三兴趣度对该兴趣类别的所述第一输入参数和所述第二数据参数进行调整;
其中,所述处理模块根据所述调整后的第一输入参数和所述调整后的第二输入参数及所述概率分布函数,确定所述第二兴趣度。
12.一种非易失性计算机可读存储介质,其特征在于,存储有计算机可读指令,可以使至少一个处理器执行如权利要求1至7任一项所述的方法。
CN201710734804.8A 2017-08-24 2017-08-24 媒体内容推送方法、装置及存储介质 Active CN110147481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710734804.8A CN110147481B (zh) 2017-08-24 2017-08-24 媒体内容推送方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710734804.8A CN110147481B (zh) 2017-08-24 2017-08-24 媒体内容推送方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110147481A true CN110147481A (zh) 2019-08-20
CN110147481B CN110147481B (zh) 2023-03-17

Family

ID=67588043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710734804.8A Active CN110147481B (zh) 2017-08-24 2017-08-24 媒体内容推送方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN110147481B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112825089A (zh) * 2019-11-21 2021-05-21 腾讯科技(北京)有限公司 文章推荐方法、装置、设备及存储介质
CN114036403A (zh) * 2022-01-07 2022-02-11 智者四海(北京)技术有限公司 用户兴趣探测方法、装置和存储介质
CN114996487A (zh) * 2022-05-24 2022-09-02 北京达佳互联信息技术有限公司 媒体资源推荐方法、装置、电子设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101107852A (zh) * 2005-01-21 2008-01-16 皇家飞利浦电子股份有限公司 一种获取一个用户群共同兴趣度的方法及装置
CN104090990A (zh) * 2014-07-31 2014-10-08 北京奇虎科技有限公司 新闻推送方法和系统
WO2015090079A1 (en) * 2013-12-16 2015-06-25 Tencent Technology (Shenzhen) Company Limited Data processing method and device applicable to network application
CN106530015A (zh) * 2016-12-08 2017-03-22 腾讯科技(深圳)有限公司 信息投放控制方法及装置
CN107087235A (zh) * 2017-04-21 2017-08-22 腾讯科技(深圳)有限公司 媒体内容推荐方法、服务器及客户端

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101107852A (zh) * 2005-01-21 2008-01-16 皇家飞利浦电子股份有限公司 一种获取一个用户群共同兴趣度的方法及装置
WO2015090079A1 (en) * 2013-12-16 2015-06-25 Tencent Technology (Shenzhen) Company Limited Data processing method and device applicable to network application
CN104090990A (zh) * 2014-07-31 2014-10-08 北京奇虎科技有限公司 新闻推送方法和系统
CN106530015A (zh) * 2016-12-08 2017-03-22 腾讯科技(深圳)有限公司 信息投放控制方法及装置
CN107087235A (zh) * 2017-04-21 2017-08-22 腾讯科技(深圳)有限公司 媒体内容推荐方法、服务器及客户端

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LEI LI: "modeling and broadening temporal user interest in personalized news recommendation" *
黄宏程等: "用户兴趣相似性度量的关系预测算法" *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112825089A (zh) * 2019-11-21 2021-05-21 腾讯科技(北京)有限公司 文章推荐方法、装置、设备及存储介质
CN112825089B (zh) * 2019-11-21 2024-03-15 深圳市雅阅科技有限公司 文章推荐方法、装置、设备及存储介质
CN114036403A (zh) * 2022-01-07 2022-02-11 智者四海(北京)技术有限公司 用户兴趣探测方法、装置和存储介质
CN114036403B (zh) * 2022-01-07 2022-03-25 智者四海(北京)技术有限公司 用户兴趣探测方法、装置和存储介质
CN114996487A (zh) * 2022-05-24 2022-09-02 北京达佳互联信息技术有限公司 媒体资源推荐方法、装置、电子设备以及存储介质
CN114996487B (zh) * 2022-05-24 2023-04-07 北京达佳互联信息技术有限公司 媒体资源推荐方法、装置、电子设备以及存储介质

Also Published As

Publication number Publication date
CN110147481B (zh) 2023-03-17

Similar Documents

Publication Publication Date Title
US10798035B2 (en) System and interface that facilitate selecting videos to share in a messaging application
CN107507612B (zh) 一种声纹识别方法及装置
CN107430630B (zh) 用于聚集和呈现与特定视频游戏相关的内容的方法、系统和介质
CN107197384B (zh) 应用于视频直播平台的虚拟机器人多模态交互方法和系统
US9253511B2 (en) Systems and methods for performing multi-modal video datastream segmentation
CN103124377B (zh) 一种带有至少一个输入装置的最少化交互系统及方法
KR102457665B1 (ko) 검색/생성된 디지털 미디어 파일을 기반으로 잠재적 관련성에 대한 주제 예측
US20090171901A1 (en) Real-time annotator
CN109522083B (zh) 一种页面智能化响应交互系统及方法
WO2018036555A1 (zh) 会话处理方法及装置
CN109635680A (zh) 多任务属性识别方法、装置、电子设备及存储介质
US20160014482A1 (en) Systems and Methods for Generating Video Summary Sequences From One or More Video Segments
JP2021182392A (ja) 情報検索方法、装置、設備、記憶媒体、及びプログラム
WO2018045011A1 (en) Personalization of experiences with digital assistants in communal settings through voice and query processing
CN102004785B (zh) 一种音乐推荐方法及装置
CN110147481A (zh) 媒体内容推送方法、装置及存储介质
CN108874831A (zh) 一种信息推荐方法及装置
CN108737903B (zh) 一种多媒体处理系统及多媒体处理方法
CN107480766A (zh) 多模态虚拟机器人的内容生成的方法和系统
CN112579822A (zh) 一种视频数据的推送方法、装置、计算机设备和存储介质
CN104581224B (zh) 切换播放内容的方法、装置及终端
CN107895004A (zh) 信息筛选方法、装置、终端设备及存储介质
WO2022033452A1 (zh) 一种音量推荐方法、装置、设备及存储介质
CN113656125A (zh) 一种虚拟助手生成的方法、装置及电子设备
US9886415B1 (en) Prioritized data transmission over networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant