CN112818237A - 一种内容推送方法、装置、设备及存储介质 - Google Patents

一种内容推送方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112818237A
CN112818237A CN202110162481.6A CN202110162481A CN112818237A CN 112818237 A CN112818237 A CN 112818237A CN 202110162481 A CN202110162481 A CN 202110162481A CN 112818237 A CN112818237 A CN 112818237A
Authority
CN
China
Prior art keywords
content
contents
candidate
recall
recalling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110162481.6A
Other languages
English (en)
Inventor
陈倩倩
景艳山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Minglue Artificial Intelligence Group Co Ltd
Original Assignee
Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minglue Artificial Intelligence Group Co Ltd filed Critical Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority to CN202110162481.6A priority Critical patent/CN112818237A/zh
Publication of CN112818237A publication Critical patent/CN112818237A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种内容推送方法、装置、设备及存储介质。包括:基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;基于设定规则对所述至少两路召回内容进行筛选,获得多条候选内容;确定每条候选内容的综合评分,并根据所述综合评分对所述多条候选内容进行排序;从排序后的多条候选内容中提取设定数量的目标候选内容,并将所述目标候选内容推送至用户。本发明实施例提供的内容推送方法,基于至少两种召回策略对待推送内容进行召回,且对召回内容按照设定规则筛选后进行排序,可以提高推送内容的准确性和多样性。

Description

一种内容推送方法、装置、设备及存储介质
技术领域
本发明实施例涉及内容推送技术领域,尤其涉及一种内容推送方法、装置、设备及存储介质。
背景技术
在推荐系统中,准确度一直是衡量系统好坏最重要的指标,大多数的工作都是在研究如何提高准确度。准确度是衡量推荐系统好坏的指标,但是仅仅研究准确度的推荐,已经不能对用户的体验和满意度有所提升。目前推荐结果的质量往往是通过多个指标来衡量,除了准确度,多样性也是重要的指标之一,另外多样化不仅解决了过度拟合的问题,同时相对于推荐系统的其他问题更加强调以人为本的个性化服务。但是,如何在准确度和多样性之间进行权衡和协同优化,从而提高业务的整体数据指标成为了现在推荐系统的又一个优化方向。
发明内容
本发明实施例提供一种内容推送方法、装置、设备及存储介质,可以提高推送内容的准确性和多样性。
第一方面,本发明实施例提供了一种内容推送方法,包括:
基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;
基于设定规则对所述至少两路召回内容进行筛选,获得多条候选内容;
确定每条候选内容的综合评分,并根据所述综合评分对所述多条候选内容进行排序;
从排序后的多条候选内容中提取设定数量的目标候选内容,并将所述目标候选内容推送至用户。
第二方面,本发明实施例还提供了一种内容推送装置,包括:
召回内容获取模块,用于基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;
候选内容获取模块,用于基于设定规则对所述至少两路召回内容进行筛选,获得多条候选内容;
综合评分确定模块,用于确定每条候选内容的综合评分,并根据所述综合评分对所述多条候选内容进行排序;
目标候选内容确定模块,用于从排序后的多条候选内容中提取设定数量的目标候选内容,并将所述目标候选内容推送至用户。
第三方面,本发明实施例还提供了一种计算机设备,所述设备包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本公开实施例所述的内容推送方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理装置执行时实现如本公开实施例所述的内容推送方法。
本发明实施例公开了一种内容推送方法、装置、设备及存储介质。基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;基于设定规则对至少两路召回内容进行筛选,获得多条候选内容;确定每条候选内容的综合评分,并根据综合评分对多条候选内容进行排序;从排序后的多条候选内容中提取设定数量的目标候选内容,并将目标候选内容推送至用户。本发明实施例提供的内容推送方法,基于至少两种召回策略对待推送内容进行召回,且对召回内容按照设定规则筛选后进行排序,可以提高推送内容的准确性和多样性。
附图说明
图1是本发明实施例一中的一种内容推送方法的流程图;
图2是本发明实施例一中的对待推送内容进行召回的示例图;
图3是本发明实施例二中的一种内容推送装置的结构示意图;
图4是本发明实施例三中的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种内容推送方法的流程图,本实施例可适用于向用户推送内容的情况,该方法可以由内容推送装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有内容推送功能的设备中,该设备可以是服务器或服务器集群等电子设备。如图1所示,该方法具体包括如下步骤:
步骤110,基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容。
其中,内容可以是新闻内容、音频内容、视频内容及商品内容等。待推送内容可以是数据中的海量内容。召回策略可以包括:基于兴趣画像的召回策略、基于新颖性内容的召回策略、基于设定算法的召回策略及设定召回策略。
示例性的,图2为本实施例中对待推送内容进行召回的示例图。如图2所示,兴趣画像包括主题、类别、标签、作者及地域,其中主题、类别、标签、作者及地域可以理解为对当前用户观看的历史内容而确定的用户感兴趣内容的主题、类别、标签、作者以及地域。新颖性内容包括距离当前时间第一设定时长内发布的内容、当前时间点击量超过设定值的内容。其中,第一设定时长可以是1-2小时,设定值可以是10万以上的任意值。距离当前时间第一设定时长内发布的内容可以理解为最新内容,当前时间点击量超过设定值可以理解为当前的最热内容。设定算法包括贝叶斯个性化排序算法(Bayesian Personalized Ranking,BPR)及交替最小二乘法(ALS)。设定策略可以包括随机召回策略及冷启动召回策略。其中,随机召回策略可以理解为随机从内容库中选择一定数据的内容召回。
步骤120,基于设定规则对至少两路召回内容进行筛选,获得多条候选内容。
本实施例中,根据至少两种召回策略召回的内容的条数数量较大,且有些内容在短时间内已经推送过,且内容从不同维度(如类别、属性)下划分后比例不满足要求,因此需要对召回的内容进行筛选,以提高召回内容的多样性。
具体的,基于设定规则对至少两路召回内容进行筛选按照如下至少一种方式执行:将与历史推送内容相同的召回内容删除;将至少两路召回内容与历史推送内容按照内容属性进行累加,将数量超过内容属性对应的第二设定数量的召回内容进行删除;对至少两路召回内容按照内容属性进行分组,并按照设定属性比例调整各内容属性对应的召回内容的数量;按照设定策略比例调整各召回策略招呼内容的数量。
其中,历史推送内容为在距离当前时间第二设定时长内召回的内容。第二设定时长可以是0.5-1小时之间的任意值。假设第二时长设置为0.5小时,则将至少两路召回内容中在0.5小时内已经推送过的内容删除。
其中,内容属性可以包括内容的标签、作者、类别、主题及地域。设定数量可以预先设置。以作者A为例,将至少两路召回内容和历史推送内容中属于作者A的内容的进行累加,若总量超过第二设定数量,则将作者A的内容从至少两路召回内容中全部删除或者部分删除,从而控制具有相同属性的内容的推送频率。
其中,设定属性比例可以包括:设定标签比例、设定作者比例、设定类别比例、设定主题比例及设定地域比例。以类别为例,将至少两路召回内容按照类别进行分桶操作,判断分桶操作后的召回内容与设定类别比例是否匹配,若不匹配,则调整各桶内的召回内容的数量,使得召回内容的类别比例与设定类别比例相匹配。对于标签、作者、主题及地域,均按照上述方式调整,使得召回在内容在各个维度的比例均匀。
其中,设定策略比例可以理解为各召回策略召回的内容的数量比例。本实施例中,可以理解为基于兴趣画像的召回策略、基于新颖性内容的召回策略、基于设定算法的召回策略及设定召回策略四种召回策略召回的内容的数量比例。通过调整各召回策略召回内容的数量,使得各召回策略召回内容的数量比例符合设定策略比例。本实施例中,基于设定规则对至少两路召回内容进行筛选,可进一步提高推送内容的多样性。
步骤130,确定每条候选内容的综合评分,并根据综合评分对多条候选内容进行排序。
其中,确定每条候选内容的综合评分的方式可以是:获取每条候选内容的基本特征、用户特征、交互特征及上下文特征;基于设定学习模型对基本特征、用户特征、用户特征及上下文特征进行处理,获得每条候选内容的综合评分。
其中,基本特征可以理解为描述内容的特征,如:标题、作者、类型、标签及主题等。用户特征可以理解为观看过该条候选内容的用户特征,如:年龄、性别等。交互特征可以理解为用户与内容之间的交互行为,如交互时间、点击、点赞等。上下文特征可以理解为内容的发布时间、内容的新鲜度、内容发表时间与请求时间之间的间隔等。
具体的,基于设定学习模型对基本特征、用户特征、用户特征及上下文特征进行处理,获得每条候选内容的综合评分的方式可以是:将基本特征、用户特征、用户特征及上下文特征输入设定学习模型,获得候选内容的总点击量、浏览时长及内容多样性;对总点击量、浏览时长及内容多样性进行加权求和,获得每条候选内容的综合评分。
其中,总点击量为用户对内容的点击操作、点赞操作、转发操作、收藏操作、曝光未点击操作及点衰操作之和。例如:点击为+1,点赞为+2,转发为+2,收藏为+2,曝光未点击为0,点衰为-1。综合评分的计算公式为:综合评分=w*总点击量+d*浏览时长+i*物料的多样性。
步骤140,从排序后的多条候选内容中提取设定数量的目标候选内容,并将目标候选内容推送至用户。
具体的,根据综合评分对多条候选内容进行排序的方式可以是:对多条候选内容按照综合评分从大到小或者从小到大的顺序排序,提取排序靠前或排序靠后第二设定数量的候选内容,作为目标候选内容。在获得目标候选内容之后,将目标候选内容推送至用户。
本实施例的技术方案,基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;基于设定规则对至少两路召回内容进行筛选,获得多条候选内容;确定每条候选内容的综合评分,并根据综合评分对多条候选内容进行排序;从排序后的多条候选内容中提取设定数量的目标候选内容,并将目标候选内容推送至用户。本发明实施例提供的内容推送方法,基于至少两种召回策略对待推送内容进行召回,且对召回内容按照设定规则筛选后进行排序,可以提高推送内容的准确性和多样性。
实施例二
图3是本发明实施例二提供的一种内容推送装置的结构示意图。如图3所示,该装置包括:
召回内容获取模块210,用于基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;
候选内容获取模块220,用于基于设定规则对至少两路召回内容进行筛选,获得多条候选内容;
综合评分确定模块230,用于确定每条候选内容的综合评分,并根据综合评分对多条候选内容进行排序;
目标候选内容确定模块240,用于从排序后的多条候选内容中提取设定数量的目标候选内容,并将目标候选内容推送至用户。
可选的,召回策略包括:基于兴趣画像的召回策略、基于新颖性内容的召回策略、基于设定算法的召回策略及设定召回策略;其中,兴趣画像包括主题、类别、标签、作者及地域;新颖性内容包括距离当前时间第一设定时长内发布的内容、当前时间点击量超过设定值的内容;设定算法包括贝叶斯个性化排序算法及交替最小二乘法;设定召回策略包括随机召回策略及冷启动召回策略。
可选的,候选内容获取模块220,还用于:
将与历史推送内容相同的召回内容删除;
将至少两路召回内容与历史推送内容按照内容属性进行累加,将数量超过内容属性对应的第一设定数量的召回内容进行删除;其中,历史推送内容为在距离当前时间第二设定时长内推送的内容;
对至少两路召回内容按照内容属性进行分组,并按照设定属性比例调整各内容属性对应的召回内容的数量;其中,内容属性包括标签、作者、类别、主题及地域;
按照设定策略比例调整各召回策略招呼内容的数量。
可选的,综合评分确定模块230,还用于:
获取每条候选内容的基本特征、用户特征、交互特征及上下文特征;
基于设定学习模型对基本特征、用户特征、用户特征及上下文特征进行处理,获得每条候选内容的综合评分。
可选的,综合评分确定模块230,还用于:
将基本特征、用户特征、用户特征及上下文特征输入设定学习模型,获得候选内容的总点击量、浏览时长及内容多样性;
对总点击量、浏览时长及内容多样性进行加权求和,获得每条候选内容的综合评分。
可选的,总点击量为用户对内容的点击操作、点赞操作、转发操作、收藏操作、曝光未点击操作及点衰操作之和。
可选的,根据综合评分对多条候选内容进行排序,包括:
对多条候选内容按照综合评分从大到小或者从小到大的顺序排序;
可选的的,目标候选内容确定模块240,还用于:
提取排序靠前或排序靠后第二设定数量的候选内容,作为目标候选内容。
上述装置可执行本发明前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明前述所有实施例所提供的方法。
实施例三
图4为本发明实施例三提供的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的计算机设备312的框图。图4显示的计算机设备312仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备312是典型的内容推送功能的计算设备。
如图4所示,计算机设备312以通用计算设备的形式表现。计算机设备312的组件可以包括但不限于:一个或者多个处理器316,存储装置328,连接不同系统组件(包括存储装置328和处理器316)的总线318。
总线318表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture,ISA)总线,微通道体系结构(Micro Channel Architecture,MCA)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association,VESA)局域总线以及外围组件互连(Peripheral Component Interconnect,PCI)总线。
计算机设备312典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备312访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
存储装置328可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory,RAM)330和/或高速缓存存储器332。计算机设备312可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统334可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory,CD-ROM)、数字视盘(Digital Video Disc-Read Only Memory,DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线318相连。存储装置328可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块326的程序336,可以存储在例如存储装置328中,这样的程序模块326包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块326通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备312也可以与一个或多个外部设备314(例如键盘、指向设备、摄像头、显示器324等)通信,还可与一个或者多个使得用户能与该计算机设备312交互的设备通信,和/或与使得该计算机设备312能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口322进行。并且,计算机设备312还可以通过网络适配器320与一个或者多个网络(例如局域网(Local AreaNetwork,LAN),广域网Wide Area Network,WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器320通过总线318与计算机设备312的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备312使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of IndependentDisks,RAID)系统、磁带驱动器以及数据备份存储系统等。
处理器316通过运行存储在存储装置328中的程序,从而执行各种功能应用以及数据处理,例如实现本发明上述实施例所提供的内容推送方法。
实施例四
本发明实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该程序被处理装置执行时实现如本发明实施例中的光斑确定方法。本发明上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;基于设定规则对所述至少两路召回内容进行筛选,获得多条候选内容;确定每条候选内容的综合评分,并根据所述综合评分对所述多条候选内容进行排序;从排序后的多条候选内容中提取设定数量的目标候选内容,并将所述目标候选内容推送至用户。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种内容推送方法,其特征在于,包括:
基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;
基于设定规则对所述至少两路召回内容进行筛选,获得多条候选内容;
确定每条候选内容的综合评分,并根据所述综合评分对所述多条候选内容进行排序;
从排序后的多条候选内容中提取设定数量的目标候选内容,并将所述目标候选内容推送至用户。
2.根据权利要求1所述的方法,其特征在在于,所述召回策略包括:基于兴趣画像的召回策略、基于新颖性内容的召回策略、基于设定算法的召回策略及设定召回策略;其中,兴趣画像包括主题、类别、标签、作者及地域;新颖性内容包括距离当前时间第一设定时长内发布的内容、当前时间点击量超过设定值的内容;设定算法包括贝叶斯个性化排序算法及交替最小二乘法;设定召回策略包括随机召回策略及冷启动召回策略。
3.根据权利要求1所述的方法,其特征在于,基于设定规则对所述至少两路召回内容进行筛选按照如下至少一种方式执行:
将与历史推送内容相同的召回内容删除;
将所述至少两路召回内容与所述历史推送内容按照内容属性进行累加,将数量超过内容属性对应的第一设定数量的召回内容进行删除;其中,所述历史推送内容为在距离当前时间第二设定时长内推送的内容;
对所述至少两路召回内容按照内容属性进行分组,并按照设定属性比例调整各内容属性对应的召回内容的数量;其中,内容属性包括标签、作者、类别、主题及地域;
按照设定策略比例调整各召回策略招呼内容的数量。
4.根据权利要求1所述的方法,其特征在于,确定每条候选内容的综合评分,包括:
获取每条候选内容的基本特征、用户特征、交互特征及上下文特征;
基于设定学习模型对所述基本特征、所述用户特征、所述用户特征及所述上下文特征进行处理,获得每条候选内容的综合评分。
5.根据权利要求4所述的方法,其特征在于,基于设定学习模型对所述基本特征、所述用户特征、所述用户特征及所述上下文特征进行处理,获得每条候选内容的综合评分,包括:
将所述基本特征、所述用户特征、所述用户特征及所述上下文特征输入设定学习模型,获得候选内容的总点击量、浏览时长及内容多样性;
对所述总点击量、浏览时长及内容多样性进行加权求和,获得每条候选内容的综合评分。
6.根据权利要求5所述的方法,其特征在于,所述总点击量为用户对内容的点击操作、点赞操作、转发操作、收藏操作、曝光未点击操作及点衰操作之和。
7.根据权利要求1所述的方法,其特征在于,根据所述综合评分对所述多条候选内容进行排序,包括:
对所述多条候选内容按照所述综合评分从大到小或者从小到大的顺序排序;
相应的,从排序后的多条候选内容中提取第二设定数量的目标候选内容,包括:
提取排序靠前或排序靠后第二设定数量的候选内容,作为目标候选内容。
8.一种内容推送装置,其特征在于,包括:
召回内容获取模块,用于基于至少两种召回策略对待推送内容进行召回,获得至少两路召回内容;
候选内容获取模块,用于基于设定规则对所述至少两路召回内容进行筛选,获得多条候选内容;
综合评分确定模块,用于确定每条候选内容的综合评分,并根据所述综合评分对所述多条候选内容进行排序;
目标候选内容确定模块,用于从排序后的多条候选内容中提取设定数量的目标候选内容,并将所述目标候选内容推送至用户。
9.一种计算机设备,其特征在于,所述设备包括:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-7任一所述的内容推送方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-7中任一所述的内容推送方法。
CN202110162481.6A 2021-02-05 2021-02-05 一种内容推送方法、装置、设备及存储介质 Pending CN112818237A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110162481.6A CN112818237A (zh) 2021-02-05 2021-02-05 一种内容推送方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110162481.6A CN112818237A (zh) 2021-02-05 2021-02-05 一种内容推送方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112818237A true CN112818237A (zh) 2021-05-18

Family

ID=75861788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110162481.6A Pending CN112818237A (zh) 2021-02-05 2021-02-05 一种内容推送方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112818237A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114708008A (zh) * 2021-12-30 2022-07-05 北京有竹居网络技术有限公司 一种推广内容处理方法、装置、设备、介质及产品
WO2023087933A1 (zh) * 2021-11-19 2023-05-25 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备、存储介质及程序产品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326431A (zh) * 2016-08-25 2017-01-11 乐视控股(北京)有限公司 一种信息推荐方法和装置
CN109948023A (zh) * 2019-03-08 2019-06-28 腾讯科技(深圳)有限公司 推荐对象获取方法、装置及存储介质
CN110442796A (zh) * 2019-08-14 2019-11-12 北京思维造物信息科技股份有限公司 一种推荐策略分桶方法、装置及设备
CN110489644A (zh) * 2019-08-13 2019-11-22 腾讯科技(北京)有限公司 信息推送方法、装置、计算机可读存储介质和计算机设备
CN111310040A (zh) * 2020-02-11 2020-06-19 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111538901A (zh) * 2020-04-15 2020-08-14 达而观信息科技(上海)有限公司 一种物品推荐方法、装置、服务器及储存介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326431A (zh) * 2016-08-25 2017-01-11 乐视控股(北京)有限公司 一种信息推荐方法和装置
CN109948023A (zh) * 2019-03-08 2019-06-28 腾讯科技(深圳)有限公司 推荐对象获取方法、装置及存储介质
CN110489644A (zh) * 2019-08-13 2019-11-22 腾讯科技(北京)有限公司 信息推送方法、装置、计算机可读存储介质和计算机设备
CN110442796A (zh) * 2019-08-14 2019-11-12 北京思维造物信息科技股份有限公司 一种推荐策略分桶方法、装置及设备
CN111310040A (zh) * 2020-02-11 2020-06-19 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111538901A (zh) * 2020-04-15 2020-08-14 达而观信息科技(上海)有限公司 一种物品推荐方法、装置、服务器及储存介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023087933A1 (zh) * 2021-11-19 2023-05-25 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备、存储介质及程序产品
CN114708008A (zh) * 2021-12-30 2022-07-05 北京有竹居网络技术有限公司 一种推广内容处理方法、装置、设备、介质及产品

Similar Documents

Publication Publication Date Title
CN107679211B (zh) 用于推送信息的方法和装置
CN110598157B (zh) 目标信息识别方法、装置、设备及存储介质
US7895227B1 (en) System and method for detecting trends in network-based content
CN112347367B (zh) 信息服务提供方法、装置、电子设备和存储介质
CN109308490B (zh) 用于生成信息的方法和装置
CN111125574A (zh) 用于生成信息的方法和装置
US20180374163A1 (en) Calculating lists of events in activity streams
CN110851712B (zh) 书籍信息的推荐方法、设备以及计算机可读介质
CN109255037B (zh) 用于输出信息的方法和装置
US20190163828A1 (en) Method and apparatus for outputting information
CN112818237A (zh) 一种内容推送方法、装置、设备及存储介质
CN113297486B (zh) 一种点击率预测方法及相关装置
CN111782933B (zh) 用于推荐书单的方法和装置
CN109947526B (zh) 用于输出信息的方法和装置
CN114330929B (zh) 内容贡献度评估方法、装置、电子设备及可读存储介质
CN116975425A (zh) 视频推荐方法、装置、电子设备及计算机可读存储介质
CN115034826A (zh) 一种广告投放方法、装置、电子设备及可读存储介质
CN112598136B (zh) 数据的校准方法和装置
CN115292487A (zh) 基于朴素贝叶斯的文本分类方法、装置、设备和介质
CN111552827B (zh) 标注方法和装置、行为意愿预测模型训练方法和装置
CN111367778B (zh) 评估搜索策略的数据分析方法和装置
CN114140723A (zh) 多媒体数据的识别方法、装置、可读介质及电子设备
CN112905885A (zh) 向用户推荐资源的方法、装置、设备、介质和程序产品
CN113220983A (zh) 基于深度学习的选品方法和装置
CN112115300A (zh) 文本处理方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination