CN112905896A - 一种推荐个数模型的训练方法、混合内容推荐方法及装置 - Google Patents

一种推荐个数模型的训练方法、混合内容推荐方法及装置 Download PDF

Info

Publication number
CN112905896A
CN112905896A CN202110337819.7A CN202110337819A CN112905896A CN 112905896 A CN112905896 A CN 112905896A CN 202110337819 A CN202110337819 A CN 202110337819A CN 112905896 A CN112905896 A CN 112905896A
Authority
CN
China
Prior art keywords
content
user
recommendation
recommended number
specified type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110337819.7A
Other languages
English (en)
Inventor
张娟
许盛辉
潘照明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Media Technology Beijing Co Ltd
Original Assignee
Netease Media Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Media Technology Beijing Co Ltd filed Critical Netease Media Technology Beijing Co Ltd
Priority to CN202110337819.7A priority Critical patent/CN112905896A/zh
Publication of CN112905896A publication Critical patent/CN112905896A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种推荐个数模型的训练方法、混合内容推荐方法及装置,所述训练方法包括:获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。利用本发明提供的方法,可以训练用于确定混合推荐列表中指定类型内容的推荐个数的推荐个数模型,以合理的进行混合内容推荐,提高用户体验。

Description

一种推荐个数模型的训练方法、混合内容推荐方法及装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种推荐个数模型的训练方法、混合内容推荐方法及装置。
背景技术
混合内容推荐是指,在信息流推荐中,对不同类型,例如图片、文字、图文、音频、视频等的内容,分别进行召回和排序后,再进行混合排序,将一定数量排序靠前的内容组合成列表,推荐给用户。
现有技术中主要存在三种混合内容推荐的方案:
(1)根据不同类型内容在同一排序模型中的分数,选取分数最高的top k集合推荐给用户。
但是,不同类型内容的点击率不同,点击率低的内容的分数低于其他内容的分数,会影响点击率低的内容的推荐个数;而且,每种类型内容的推荐个数随排序结果变化,依赖排序模型的打分,混合排序推荐的结果不可控。
(2)根据不同类型内容在不同排序模型中的分数,选取分数最高的top k集合推荐给用户。
但是,不同排序模型分别对不同类型内容打分,获得的每种类型内容的分数之间没有比较的意义;而且,上述方案也存在混合排序推荐的结果不可控的问题。
(3)综合考虑影响用户偏好程度的因素,基于人工经验设置明确的规则和策略,计算每种类型内容的推荐个数。
然而,当考虑的因素逐渐变多时,上述规则的设置变得复杂、难以控制,可行性较低;且上述方案依赖人工经验,效率较低。
在基于排序模型打分的基础上,针对不同类型的推荐内容,如何合理确定各类型的推荐个数,以提升推荐内容的曝光程度,最大程度的满足用户需求,需要提供相应的解决方案。
发明内容
本发明实施例提供一种推荐个数模型的训练方法、混合内容推荐方法及装置,解决现有的混合内容推荐的方案中存在的,确定各类型内容的推荐个数的方法不合理,混合内容推荐结果不可控的问题。
第一方面,本发明实施例提供一种推荐个数模型的训练方法,用于确定混合推荐列表中指定类型内容的推荐个数,该方法包括:
获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;
根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;
对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。
在一种可能的实施方式中,根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数,包括:
确定用户点击所述指定类型内容的次数等于第一阈值时,将所述实际推荐个数作为期望推荐个数;
确定用户点击所述指定类型内容的次数大于第一阈值时,将所述实际推荐个数递增得到期望推荐个数;
确定用户点击所述指定类型内容的次数小于第一阈值时,将所述实际推荐个数递减得到期望推荐个数。
本发明实施例提供的推荐个数模型的训练方法,将用户点击指定类型内容的次数与预设的第一阈值进行比较,并提供了在不同大小关系下,一种合理的确定期望推荐个数的具体方式,提高了上述推荐个数模型的训练方法的可靠性及合理性。
在一种可能的实施方式中,所述提取的特征和对应的期望推荐个数为一个样本,调整所述推荐个数模型的参数之前,还包括:
获取包括多个样本的样本集;
确定样本集中用户点击所述指定类型内容的次数小于第一阈值,且所述实际推荐个数小于第二阈值的待筛选样本;
按设定比例筛选掉待筛选样本中的部分样本,得到更新的样本集。
本发明实施例提供的推荐个数模型的训练方法,将提取的特征和对应的期望推荐个数作为一个样本,在样本集中按照预设比例筛选掉,因实际推荐个数过小而点击次数不符合要求的样本,提高样本集的合理性,使根据上述筛选过的样本集进行训练的推荐个数模型的合理性更高,提高上述推荐个数模型的训练方法的可靠性。
在一种可能的实施方式中,对所述用户的属性信息进行特征提取,包括:
对所述用户的性别、年龄、地理位置中至少一种进行特征提取。
本发明实施例提供的推荐个数模型的训练方法,提供了上述用户的属性信息可能的具体类型,通过对多方面的用户的属性信息中的至少一个进行特征提取,提高了上述推荐个数模型的训练方法的可实施性和合理性。
在一种可能的实施方式中,对所述内容推荐时用户所处的上下文信息进行特征提取,包括:
对所述内容推荐的时间、内容推荐时用户登录的客户端类型、内容推荐时客户端连接的网络类型中至少一种进行特征提取。
本发明实施例提供的推荐个数模型的训练方法,提供了上述内容推荐时用户所处的上下文信息可能的具体类型,通过对多方面的内容推荐时用户所处的上下文信息中的至少一个进行特征提取,提高了上述推荐个数模型的训练方法的可实施性和合理性。
在一种可能的实施方式中,对所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,包括:
对不同历史时间窗口内,所述用户对指定类型内容的正向操作次数和/或负向操作次数进行特征提取。
本发明实施例提供的推荐个数模型的训练方法,提供了上述用户对指定类型内容的历史操作信息可能的具体类型,通过对多方面的用户对指定类型内容的历史操作信息中的至少一个进行特征提取,提高了上述推荐个数模型的训练方法的可实施性和合理性;和上述两种实施方式相结合,提高了上述推荐个数模型的训练方法的全面性。
在一种可能的实施方式中,将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数,包括:
将提取的特征输入所述推荐个数模型,得到预测的推荐个数;
根据所述预测的推荐个数和所述期望推荐个数的差值得到损失函数值,利用所述损失函数值调整所述推荐个数模型的参数。
本发明实施例提供的推荐个数模型的训练方法,通过损失函数计算损失函数值,调整上述推荐个数模型的参数,提供了一种具体的模型调参方法,提高了推荐个数模型的训练方法的可实施性,提高了上述推荐个数模型的准确性。
在一种可能的实施方式中,所述方法还包括:
在推荐个数模型的建模阶段,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数;
在推荐个数模型的更新阶段,利用所述推荐个数模型,确定所述混合推荐列表中指定类型内容的实际推荐个数。
本发明实施例提供的推荐个数模型的训练方法,将推荐个数模型划分为建模阶段和更新阶段,提供了在上述两种阶段确定实际推荐个数的具体方式,在推荐个数模型效果较差的建模阶段使用排序模型确定实际推荐个数,在推荐个数模型效果达到预设标准的更新阶段使用推荐个数模型确定实际推荐个数,降低了模型训练的难度,减少了模型训练的时间,提高了推荐个数模型的训练方法的可靠性。
在一种可能的实施方式中,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数,包括:
根据同一排序模型对不同类型内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数;或
根据不同排序模型对相应类型的内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数。
本发明实施例提供的推荐个数模型的训练方法,提供了两种排序模型评分、排序的具体实施方式,使用同一排序模型对不同类型内容的推荐程度评分,或不同排序模型对相应类型的内容的推荐程度评分,增强了上述推荐个数模型的训练方法的灵活性。
第二方面,本发明实施例提供一种混合排序推荐的方法,应用于推荐服务器,该方法包括:
接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;
对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于上述第一方面中任一项所述方法训练得到的;
根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
本发明实施例提供的混合排序推荐的方法,使用上述第一方面训练得到的推荐个数模型指定类型内容的推荐个数,并根据不同类型内容的推荐程度评分得到混合推荐列表,对用户进行混合排序推荐,利用机器学习技术,提供了一种推荐结果可控、且实现简单的混合排序推荐的方法,提高了混合排序推荐的方法的可行性,合理地进行混合排序推荐,提升推荐内容的曝光程度,最大程度的满足用户需求,为用户带来了较好的推荐体验。
第三方面,本发明实施例提供一种推荐个数模型的训练装置,包括:
数据获取单元,用于获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;
个数确定单元,用于根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;
特征提取单元,用于对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
参数调整单元,用于将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。
在一种可能的实施方式中,所述个数确定单元根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数,包括:
确定用户点击所述指定类型内容的次数等于第一阈值时,将所述实际推荐个数作为期望推荐个数;
确定用户点击所述指定类型内容的次数大于第一阈值时,将所述实际推荐个数递增得到期望推荐个数;
确定用户点击所述指定类型内容的次数小于第一阈值时,将所述实际推荐个数递减得到期望推荐个数。
在一种可能的实施方式中,所述提取的特征和对应的期望推荐个数为一个样本,所述参数调整单元调整所述推荐个数模型的参数之前,还用于:
获取包括多个样本的样本集;
确定样本集中用户点击所述指定类型内容的次数小于第一阈值,且所述实际推荐个数小于第二阈值的待筛选样本;
按设定比例筛选掉待筛选样本中的部分样本,得到更新的样本集。
在一种可能的实施方式中,所述特征提取单元对所述用户的属性信息进行特征提取,包括:
对所述用户的性别、年龄、地理位置中至少一种进行特征提取。
在一种可能的实施方式中,所述特征提取单元对所述内容推荐时用户所处的上下文信息进行特征提取,包括:
对所述内容推荐的时间、内容推荐时用户登录的客户端类型、内容推荐时客户端连接的网络类型中至少一种进行特征提取。
在一种可能的实施方式中,所述特征提取单元对所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,包括:
对不同历史时间窗口内,所述用户对指定类型内容的正向操作次数和/或负向操作次数进行特征提取。
在一种可能的实施方式中,所述参数调整单元将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数,包括:
将提取的特征输入所述推荐个数模型,得到预测的推荐个数;
根据所述预测的推荐个数和所述期望推荐个数的差值得到损失函数值,利用所述损失函数值调整所述推荐个数模型的参数。
在一种可能的实施方式中,所述个数确定单元还用于:
在推荐个数模型的建模阶段,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数;
在推荐个数模型的更新阶段,利用所述推荐个数模型,确定所述混合推荐列表中指定类型内容的实际推荐个数。
在一种可能的实施方式中,所述个数确定单元根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数,包括:
根据同一排序模型对不同类型内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数;或
根据不同排序模型对相应类型的内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数。
第四方面,本发明实施例提供一种混合排序推荐的装置,包括:
请求接收单元,用于接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;
特征提取单元,用于对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
特征输入单元,用于将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于第一方面中任一项所述方法训练得到的;
列表确定单元,用于根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
第五方面,本发明实施例提供一种推荐个数模型的训练设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行:
获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;
根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;
对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。
在一种可能的实施方式中,所述处理器根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数,包括:
确定用户点击所述指定类型内容的次数等于第一阈值时,将所述实际推荐个数作为期望推荐个数;
确定用户点击所述指定类型内容的次数大于第一阈值时,将所述实际推荐个数递增得到期望推荐个数;
确定用户点击所述指定类型内容的次数小于第一阈值时,将所述实际推荐个数递减得到期望推荐个数。
在一种可能的实施方式中,所述提取的特征和对应的期望推荐个数为一个样本,所述处理器调整所述推荐个数模型的参数之前,还用于:
获取包括多个样本的样本集;
确定样本集中用户点击所述指定类型内容的次数小于第一阈值,且所述实际推荐个数小于第二阈值的待筛选样本;
按设定比例筛选掉待筛选样本中的部分样本,得到更新的样本集。
在一种可能的实施方式中,所述处理器对所述用户的属性信息进行特征提取,包括:
对所述用户的性别、年龄、地理位置中至少一种进行特征提取。
在一种可能的实施方式中,所述特征提取单元对所述内容推荐时用户所处的上下文信息进行特征提取,包括:
对所述内容推荐的时间、内容推荐时用户登录的客户端类型、内容推荐时客户端连接的网络类型中至少一种进行特征提取。
在一种可能的实施方式中,所述处理器对所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,包括:
对不同历史时间窗口内,所述用户对指定类型内容的正向操作次数和/或负向操作次数进行特征提取。
在一种可能的实施方式中,所述处理器将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数,包括:
将提取的特征输入所述推荐个数模型,得到预测的推荐个数;
根据所述预测的推荐个数和所述期望推荐个数的差值得到损失函数值,利用所述损失函数值调整所述推荐个数模型的参数。
在一种可能的实施方式中,所述处理器还用于:
在推荐个数模型的建模阶段,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数;
在推荐个数模型的更新阶段,利用所述推荐个数模型,确定所述混合推荐列表中指定类型内容的实际推荐个数。
在一种可能的实施方式中,所述处理器根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数,包括:
根据同一排序模型对不同类型内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数;或
根据不同排序模型对相应类型的内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数。
第六方面,本发明实施例提供一种混合排序推荐的设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行:
接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;
对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于第一方面中任一项所述方法训练得到的;
根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
第七方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述第一方面提供的推荐个数模型的训练方法的步骤。
第八方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述第二方面提供的混合排序推荐的方法的步骤。
本发明实施例提供的推荐个数模型的训练方法,基于用户对指定类型内容的行为反馈及指定类型内容的实际推荐个数,计算符合用户需求的期望推荐个数;并对上述用户的属性信息、内容推荐时用户所处的上下文信息和上述用户对指定类型内容的历史操作信息中至少一种进行特征提取,以提取的特征进行模型训练,综合考虑了多种影响用户在内容推荐时对指定类型内容的偏好程度的因素,提高了推荐个数模型的可靠性及合理性。
附图说明
图1为本发明实施例提供的一种混合内容推荐方法的应用场景示意图;
图2为本发明实施例提供的一种推荐个数模型的训练方法的流程图;
图3为本发明实施例提供的一种推荐个数模型的示意图;
图4为本发明实施例提供的一种混合排序推荐的方法的流程图,应用于推荐服务器;
图5为本发明实施例提供的一种推荐个数模型的训练装置的示意图;
图6为本发明实施例提供的一种混合排序推荐的装置的示意图;
图7为本发明实施例提供的一种推荐个数模型的训练设备的示意图;
图8为本发明实施例提供的一种混合排序推荐的设备的示意图;
图9为本发明实施例提供的一种推荐个数模型的训练程序产品的示意图;
图10为本发明实施例提供的一种混合排序推荐的程序产品的示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种推荐个数模型的训练方法、混合内容推荐方法及装置。
在本文中,需要理解的是,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
为了方便理解,下面对本申请实施例中涉及的名词进行解释:
损失函数:是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在应用中,损失函数通常作为学习准则与优化问题相联系,即通过最小化损失函数求解和评估模型。例如,在机器学习中,损失函数被用于模型的参数估计(Parameteric Estimation,PE),基于损失函数得到的损失值可用来描述模型的预测值与实际值的差异程度。常见的损失函数有均方误差损失函数、支持向量机(SupportVector Machine,SVM)合页损失函数、交叉熵损失函数等。
召回:是推荐系统的一个环节。推荐系统一般由召回、排序、重排三个阶段组成,召回是指用一些高效的算法从整个大的推荐集中召回与用户兴趣或对应内容相关度高的一部分内容作为排序阶段的候选集合。
有监督训练:又称监督学习,是机器学习中的一种方法,可以由训练资料中学到或建立一个模式,并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。
强化学习(Reinforcement Learning,RL):又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
轻量级梯度提升机(Light Gradient Boosting Machine,Light GBM):是一个实现梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法的轻量级框架,支持高效率的并行训练,并且具有更快的训练效率、更高的准确率,可以低内存使用、可处理大规模数据。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
本发明人发现,在混合内容推荐时,如何选取合适的各类型内容的推荐个数,以提升推荐内容的曝光程度,最大程度的满足用户需求,是一个比较复杂的问题。
现有技术中主要存在三种混合内容推荐的方案:
(1)根据不同类型内容在同一排序模型中的分数,选取分数最高的top k集合推荐给用户。
直接根据不同类型内容在同一排序模型中的得分,让不同类型内容竞争,选取出top k集合推荐给用户,是比较常用的混合内容推荐方法。在这种方法中,不同类型内容的推荐个数由排序模型打分决定。
但是,不同类型内容的点击率不同,点击率低的内容的分数低于其他内容的分数,会影响点击率低的内容的推荐个数。
而且,每种类型内容的推荐个数随排序结果变化,依赖排序模型的打分,混合排序推荐的结果不可控。
(2)根据不同类型内容在不同排序模型中的分数,选取分数最高的top k集合推荐给用户。
直接根据不同类型内容在不同排序模型中的得分,让不同类型内容竞争,选取出top k集合推荐给用户,是另一种比较常用的混合内容推荐方法。在这种方法中,不同类型内容的推荐个数由排序模型打分决定。
但是,不同排序模型分别对不同类型内容打分,造成了不同类型内容打分不在同一得分空间,获得的每种类型内容的分数之间没有比较的意义。
而且,上述方案也存在混合排序推荐的结果不可控的问题。
(3)综合考虑影响用户偏好程度的因素,基于人工经验设置明确的规则和策略,计算每种类型内容的推荐个数。
上述方式不依赖排序模型的打分,直接计算不同类型内容的推荐个数,也是比较常用的不同类型内容的混合内容推荐方法。
然而,当考虑的因素逐渐变多时,上述规则的设置变得复杂、难以控制,可行性较低;且上述方案依赖人工经验,效率较低。
有鉴于此,本发明实施例提供了一种推荐个数模型的训练方法,包括:基于用户对指定类型内容的行为反馈及指定类型内容的实际推荐个数,计算更符合用户需求的期望推荐个数;并对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,以提取的特征进行模型训练,综合考虑多种影响用户在内容推荐时对指定类型内容的偏好程度的因素,以提高推荐个数模型的可靠性及合理性。本发明实施例基于上述训练方法获得的推荐个数模型进行混合内容推荐,包括:接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;将提取的特征输入到推荐个数模型;根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户,以提升推荐内容的曝光程度,最大程度的满足用户需求。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
首先参考图1,其为本发明实施例提供的一种混合内容推荐方法的应用场景示意图。
用户设备11,用于向下述推荐服务器发送推荐请求,并接收下述推荐服务器发送的混合推荐列表;
推荐服务器12,用于接收用户通过上述用户设备11发送的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于本发明实施例任一推荐个数模型的训练方法训练得到的;根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
上述用户设备11与上述推荐服务器12之间通过网络进行通信连接,该网络可以为局域网、广域网等。
上述用户设备11可以为便捷设备(例如:手机、平板、笔记本电脑等),也可以为个人电脑(PC,Personal Computer)。
上述推荐服务器12可以为任何能够提供互联网服务的设备。
用户通过上述用户设备11中安装的客户端与上述推荐服务器12进行数据交互,其中,上述客户端可以为网页的浏览器,也可以为安装于移动用户设备,如手机,平板电脑等中的应用客户端。
需要说明的是,上述应用场景仅是对本发明实施例中一种可能的实施方式的说明,并不对本发明实施例产生限定,相反,本申请的实施方式可以应用于适用的任何场景,且上述应用场景可以根据具体的实施情况进行实体的增减、删改。
示例性方法
如图2所示,为本发明实施例提供的一种推荐个数模型的训练方法的流程图,用于确定混合推荐列表中指定类型内容的推荐个数,包括如下步骤:
步骤S201,获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;
本发明实施例以用户的一次混合排序推荐为采样单位,采集训练推荐个数模型所需要的样本数据,即,根据混合推荐列表和用户对上述混合推荐列表中指定类型内容的行为反馈采集样本数据。
需要说明的是,上述行为反馈为用户是否对上述指定类型内容进行了相关操作,可以包括用户对上述指定类型内容未执行相关操作,也可以包括用户对上述指定类型内容执行了相关操作。
更进一步的,当用户对上述指定类型内容执行了相关操作时,上述行为反馈可以包括上述相关操作的具体操作类型及操作的次数,具体可以包括但不限于用户点击上述指定类型内容的次数。
作为一种可选的实施方式,上述指定类型内容为视频类型内容。
步骤S202,根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;
上述期望推荐个数是指符合用户对上述指定类型内容的偏好程度的推荐个数。
本发明实施例基于强化学习中的反馈和探索思想,将上述行为反馈转化成上述指定类型内容的期望推荐个数。
判断用户是否对上述指定类型内容进行了相关操作。
当用户对上述指定类型内容未执行相关操作时,认为上述实际推荐个数偏大,上述期望推荐个数可相应减少。
当用户对上述指定类型内容执行了相关操作时,根据上述相关操作的具体操作类型及操作的次数,对实际推荐个数进行调整,确定期望推荐个数。
例如,当上述相关操作的具体操作类型为正向操作时,将所述实际推荐个数递增得到期望推荐个数;当上述相关操作的具体操作类型为负向操作时,将所述实际推荐个数递减得到期望推荐个数。
上述正向操作可以包括:上述用户点击上述指定类型内容;或上述用户点击上述指定类型内容的次数达到预设阈值;或上述用户点击上述指定类型内容后停留时间达到预设阈值。
上述负向操作可以包括:上述用户点击上述指定类型内容的次数未达到预设阈值;或上述用户点击上述指定类型内容后停留时间未达到预设阈值。
又例如,当上述相关操作的次数达到预设阈值时,将所述实际推荐个数递增得到期望推荐个数;当上述相关操作的次数未达到预设阈值时,将所述实际推荐个数递减得到期望推荐个数。
另外,可以将上述相关操作的具体操作类型及次数结合确定期望推荐个数。
而且,可以根据上述相关操作的次数具体设置调整的幅度:确定上述相关操作的次数大于第一预设值时,将所述实际推荐个数按照第一幅度递增,得到期望推荐个数;确定上述相关操作的次数小于第一预设值且大于第二预设值时,将所述实际推荐个数按照第二幅度递增,得到期望推荐个数;确定上述相关操作的次数小于第二预设值时,将所述实际推荐个数按照第三幅度递增,得到期望推荐个数,其中,上述第一预设值大于第二预设值。
作为一种可选的实施方式,根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数,包括:
确定用户点击所述指定类型内容的次数等于第一阈值时,将所述实际推荐个数作为期望推荐个数;
确定用户点击所述指定类型内容的次数大于第一阈值时,将所述实际推荐个数递增得到期望推荐个数;
确定用户点击所述指定类型内容的次数小于第一阈值时,将所述实际推荐个数递减得到期望推荐个数。
上述第一阈值可以根据具体的实施情况进行具体设置,本发明实施例对此不作任何限定。
上述对实际推荐个数的递增/递减的调整操作的具体形式,可以根据具体的实施情况进行具体设置,本发明实施例对此不作任何限定。
作为一种可选的实施方式,将上述第一阈值设置为1,上述对实际推荐个数的递增/递减的调整操作为对实际推荐个数进行加1/减1。
(1)如果上述用户点击上述指定类型内容的次数a=1,则认为上述实际推荐个数y'值是合理的推荐个数,将上述实际推荐个数作为上述期望推荐个数,即上述期望推荐个数Y=y';
(2)如果上述用户点击上述指定类型内容的次数a>1,则认为上述实际推荐个数y'值偏小,上述期望推荐个数可放开探索,将上述实际推荐个数递增得到期望推荐个数,即上述期望推荐个数Y=y'+1;
(3)如果上述用户点击上述指定类型内容的次数a<1,即a=0,则认为上述实际推荐个数y'值偏大,上述期望推荐个数可相应减少,将所述实际推荐个数递减得到期望推荐个数,即上述期望推荐个数Y=y'-1。
需要说明的是,上述用户点击上述指定类型内容的次数小于上述第一阈值的情况的产生原因,也有可能是上述实际推荐个数过小。
将上述因实际推荐个数过小,导致上述用户点击上述指定类型内容的次数小于上述第一阈值的样本,作为置信度较低的样本,基于一定比例,对上述样本进行下采样丢弃。
作为一种可选的实施方式,调整所述推荐个数模型的参数之前,还包括:
获取包括多个样本的样本集;
上述样本集中的各样本均包括提取的特征和对应的期望推荐个数。
确定样本集中用户点击所述指定类型内容的次数小于第一阈值,且所述实际推荐个数小于第二阈值的待筛选样本;
按设定比例筛选掉待筛选样本中的部分样本,得到更新的样本集。
上述第二阈值可以根据具体的实施情况进行具体设置,本发明实施例对此不作任何限定。
需要说明的是,对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,提取的特征和上述期望推荐个数分别以实时日志的形式被计算和记录,然后拼接同一混合排序推荐下的上述提取的特征和上述期望推荐个数,生成模型训练所需要的样本数据。
上述混合列表中指定类型内容的实际推荐个数在推荐个数模型的不同阶段使用不同的确定方式:
实施方式1:在推荐个数模型的建模阶段,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数;
需要说明的是,上述推荐个数模型的建模阶段和下述更新阶段可以根据上述推荐个数模型的损失函数值进行区分。
若上述损失函数值大于预设值,确定上述推荐个数模型在建模阶段;
否则,确定上述推荐个数模型在更新阶段。
需要说明的是,在生成上述混合推荐列表时,根据当前推荐个数模型,确定上述实际推荐个数。
作为一种可选的实施方式,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数,包括:
根据同一排序模型对不同类型内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数;或
根据不同排序模型对相应类型的内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数。
上述排序模型可以为根据不同类型内容进行推荐程度评分训练获得的模型,使用上述排序模型对不同类型内容的推荐程度进行评分,然后根据上述评分对不同类型内容进行混合排序。
上述排序模型也可以为针对设定类型的内容进行训练获得的排序模型,分别使用不同排序模型对相应类型的内容的推荐程度评分,然后根据上述评分对不同类型内容进行混合排序。
依据上述推荐程度评分的分数进行上述混合排序,分数高的内容排序靠前。
需要说明的是,上述预设数量为上述混合推荐列表中不同类型内容的总个数,可以根据具体的实施情况进行具体设置,本发明实施例对此不作任何限定。
实施方式2:在推荐个数模型的更新阶段,利用所述推荐个数模型,确定所述混合推荐列表中指定类型内容的实际推荐个数。
当上述损失函数值不大于预设值,认为上述推荐个数模型的推荐效果可以接受,确定上述推荐个数模型在更新阶段,利用上述更新阶段的推荐个数模型,确定上述混合推荐列表中指定类型内容的实际推荐个数。
步骤S203,对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
在每一次混合排序推荐中,上述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息都是已知的。
需要说明的是,任意进行特征提取的方式都可以应用到本发明实施例中,本发明实施例对此不作任何限定。
作为一种可选的实施方式,对上述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息进行特征提取,生成基础特征和统计特征,得到61维特征。
需要说明的是,上述提取的特征的维数可以根据具体的实施情况进行具体设置,本发明实施例对此不作任何限定。
上述提取的每一维特征均具有明确的特征含义,例如,以其中一维特征表征用户的性别。
作为一种可选的实施方式,对所述用户的属性信息进行特征提取,包括:
对所述用户的性别、年龄、地理位置中至少一种进行特征提取。
上述用户的地理位置可以为不同精度的地理位置,例如,省、市、县等;也可以为对地理位置的属性划分,例如是否为一线/二线/三线城市、南方或北方、是否为海滨城市等。
需要说明的是,上述用户的属性信息包括但不限于上述用户的性别、年龄、地理位置,任意影响用户期望推荐个数的信息都可以应用到本发明实施例中的用户的属性信息中,例如,用户的出生日期、民族等,本发明实施例对此不作任何限定。
作为一种可选的实施方式,对所述内容推荐时用户所处的上下文信息进行特征提取,包括:
对所述内容推荐的时间、内容推荐时用户登录的客户端类型、内容推荐时客户端连接的网络类型中至少一种进行特征提取。
上述内容推荐的时间可以为不同精度的时间信息,例如日期、几点几分几秒等;也可以为对内容推荐的时间的属性划分,例如,是否为工作日/假期、白天/夜晚、工作日的休息时间/工作日的工作时间等。
上述内容推荐时用户登录的客户端类型可以为对网页/PC端/移动端的区分;也可以为对客户端的系统类型的划分,例如苹果公司开发的移动操作系统IOS或美国谷歌公司开发的移动操作系统Android。
上述内容推荐时客户端连接的网络类型可以为数据流量,或无线网络。
需要说明的是,上述内容推荐时用户所处的上下文信息包括但不限于上述内容推荐的时间、内容推荐时用户登录的客户端类型、内容推荐时客户端连接的网络类型,任意影响用户期望推荐个数的信息都可以应用到本发明实施例中的上述内容推荐时用户所处的上下文信息中,本发明实施例对此不作任何限定。
作为一种可选的实施方式,对所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,包括:
对不同历史时间窗口内,所述用户对指定类型内容的正向操作次数和/或负向操作次数进行特征提取。
上述不同历史时间窗口可以根据具体的实施情况进行具体设置,本发明实施例对此不作任何限定。
例如,若历史操作时间大于第一阈值,确定上述历史操作为长期操作行为;
若历史操作时间小于上述第一阈值且大于第二阈值,确定上述历史操作为近期操作行为;
若历史操作时间小于上述第二阈值,确定上述历史操作为实时操作行为;
其中,上述第一阈值大于上述第二阈值。
上述正向操作可以为用户进行好评、分享、点击次数大于预设值等;
上述负向操作可以为用户进行差评、屏蔽等负向标记。
步骤S204,将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。
本发明实施例的推荐个数模型为基于机器学习中的有监督学习方法建模确定的。基于有监督数据训练生成上述提取的特征和期望推荐个数的映射模型。
如图3所示,本发明实施例提供的一种推荐个数模型的示意图。
对上述用户的属性信息、内容推荐时用户所处的上下文信息和上述用户对指定类型内容的历史操作信息中至少一种进行特征提取,以上述提取的特征为输入X值,以上述期望推荐个数为标签Y值,将上述X值和Y值整合作为样本数据。
Y=f(X),其中,f是有监督学习方法基于上述样本数据学习得到模型。
作为一种可选的实施方式,将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数,包括:
将提取的特征输入所述推荐个数模型,得到预测的推荐个数;
根据所述预测的推荐个数和所述期望推荐个数的差值得到损失函数值,利用所述损失函数值调整所述推荐个数模型的参数。
上述Y值为一个回归值。
作为一种可选的实施方式,使用均方误差(Mean-Square Error,MSE)作为损失函数,训练回归模型。
上述MSE损失函数:loss=∑(Y-Y′)2,其中,Y为根据上述行为反馈及上述实际推荐个数确定的指定类型内容的期望推荐个数,即上述样本数据中的Y值,Y'为上述推荐个数模型预测的推荐个数。
需要说明的是,上述MSE损失函数仅是对本发明实施例的损失函数的一种举例,任意损失函数均可以应用到本发明实施例中,本发明实施例对此不做任何限定。
作为一种可选的实施方式,上述推荐个数模型使用LightGBM模型拟合回归Y值。
与LR等其他机器学习模型相比,LightGBM模型更适合处理连续型特征,且能够处理非线性特征,自动做特征交叉。
本发明实施例使用的样本中,X值基本由连续型特征组成,选择LightGBM模型训练上述推荐个数模型可以避免繁杂的特征工程。
需要说明的是,上述LightGBM模型仅是对本发明实施例的机器学习模型的一种举例,任意可以实现本发明功能的机器学习模型均可以应用到本发明实施例中,本发明实施例对此不做任何限定。
基于上述样本数据训练得到符合预设结束条件的推荐个数模型。
上述预设结束条件可以损失函数值小于预设阈值,或达到预设的训练次数,或达到预设的训练时间等。
如图4所示,本发明实施例提供一种混合排序推荐的方法的流程图,应用于推荐服务器,包括:
步骤S401,接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;
上述用户的属性信息、内容推荐时用户所处的上下文信息和上述用户对指定类型内容的历史操作信息和上述推荐个数模型的训练方法中出现的用户的属性信息、内容推荐时用户所处的上下文信息和上述用户对指定类型内容的历史操作信息概念相同,在此不再赘述。
步骤S402,对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
上述特征提取的方式和上述推荐个数模型的训练方法中使用的特征提取的方式相同,在此不再赘述。
步骤S403,将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于任一项上述推荐个数模型的训练方法训练得到的;
步骤S404,根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
在混合排序推荐阶段,只要捕捉到该次混合排序推荐的用户的属性信息、内容推荐时用户所处的上下文信息和用户对指定类型内容的历史操作信息中至少一种,进行特征提取后将提取到的特征输入到上述推荐个数模型中,就可以得到上述推荐个数模型预测的推荐个数。
作为一种可选的实施方式,根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表,包括:
根据排序模型对不同类型内容的推荐程度评分,对不同类型内容进行混合排序;
根据上述推荐个数模型预测的推荐个数,和混合排序结果,生成不同类型内容混合排序的混合推荐列表。
需要说明的是,上述混合推荐列表中不同类型内容的总个数为预设值。
当上述混合推荐列表包括的内容的类型为两种时,使用预先训练好的推荐个数模型确定混合推荐列表中指定类型内容的推荐个数,另一类型内容的个数通过上述预设值和推荐个数确定。
作为一种可选的实施方式,对视频类型内容和图文类型内容进行混合排序推荐。
当上述混合推荐列表包括的内容的类型为N种时,使用至少一个预先训练好的推荐个数模型,确定混合推荐列表中至少一个对应的指定类型内容的推荐个数,并根据上述混合排序结果,确定剩余类型内容的推荐个数。
示例性设备
在介绍了本发明示例性实施方式的方法之后,接下来,对本申请示例性实施方式的推荐个数模型的训练装置、混合排序推荐的装置等进行介绍。
如图5所示,基于相同的发明构思,本发明实施例还提供了一种推荐个数模型的训练装置,包括:
数据获取单元501,用于获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;
个数确定单元502,用于根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;
特征提取单元503,用于对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
参数调整单元504,用于将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。
在一种可能的实施方式中,所述个数确定单元502根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数,包括:
确定用户点击所述指定类型内容的次数等于第一阈值时,将所述实际推荐个数作为期望推荐个数;
确定用户点击所述指定类型内容的次数大于第一阈值时,将所述实际推荐个数递增得到期望推荐个数;
确定用户点击所述指定类型内容的次数小于第一阈值时,将所述实际推荐个数递减得到期望推荐个数。
在一种可能的实施方式中,所述提取的特征和对应的期望推荐个数为一个样本,所述参数调整单元504调整所述推荐个数模型的参数之前,还用于:
获取包括多个样本的样本集;
确定样本集中用户点击所述指定类型内容的次数小于第一阈值,且所述实际推荐个数小于第二阈值的待筛选样本;
按设定比例筛选掉待筛选样本中的部分样本,得到更新的样本集。
在一种可能的实施方式中,所述特征提取单元503对所述用户的属性信息进行特征提取,包括:
对所述用户的性别、年龄、地理位置中至少一种进行特征提取。
在一种可能的实施方式中,所述特征提取单元503对所述内容推荐时用户所处的上下文信息进行特征提取,包括:
对所述内容推荐的时间、内容推荐时用户登录的客户端类型、内容推荐时客户端连接的网络类型中至少一种进行特征提取。
在一种可能的实施方式中,所述特征提取单元503对所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,包括:
对不同历史时间窗口内,所述用户对指定类型内容的正向操作次数和/或负向操作次数进行特征提取。
在一种可能的实施方式中,所述参数调整单元504将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数,包括:
将提取的特征输入所述推荐个数模型,得到预测的推荐个数;
根据所述预测的推荐个数和所述期望推荐个数的差值得到损失函数值,利用所述损失函数值调整所述推荐个数模型的参数。
在一种可能的实施方式中,所述个数确定单元502还用于:
在推荐个数模型的建模阶段,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数;
在推荐个数模型的更新阶段,利用所述推荐个数模型,确定所述混合推荐列表中指定类型内容的实际推荐个数。
在一种可能的实施方式中,所述个数确定单元502根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数,包括:
根据同一排序模型对不同类型内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数;或
根据不同排序模型对相应类型的内容的推荐程度评分,对不同类型内容进行混合排序,并统计预设数量排序靠前的不同类型内容中,所述指定类型内容的数量,得到所述实际推荐个数。
如图6所示,基于相同的发明构思,本发明实施例还提供了一种混合排序推荐的装置,包括:
请求接收单元601,用于接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;
特征提取单元602,用于对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
特征输入单元603,用于将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于图5中推荐个数模型的训练装置训练得到的;
列表确定单元604,用于根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
下面参照图7来描述根据本发明的这种实施方式的推荐个数模型的训练设备70。图7显示的推荐个数模型的训练设备70仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,推荐个数模型的训练设备70可以以通用计算设备的形式表现,例如其可以为终端设备。推荐个数模型的训练设备70的组件可以包括但不限于:上述至少一个处理单元71、上述至少一个存储单元72、连接不同系统组件(包括存储单元72和处理单元71)的总线73。
总线73可以包括数据总线、地址总线和控制总线。
存储单元72可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)721和/或高速缓存存储器722,还可以进一步包括只读存储器(ROM)723。
存储单元72还可以包括具有一组(至少一个)程序模块724的程序/实用工具725,这样的程序模块724包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
推荐个数模型的训练设备70也可以与一个或多个外部设备74(例如键盘、指向设备等)通信,这种通信可以通过输入/输出(I/O)接口75进行。并且,推荐个数模型的训练设备70还可以通过网络适配器76与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器76通过总线73与推荐个数模型的训练设备70的其它模块通信。应当明白,尽管图中未示出,可以结合推荐个数模型的训练设备70使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
下面参照图8来描述根据本发明的这种实施方式的混合排序推荐的设备80。图8显示的混合排序推荐的设备80仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,混合排序推荐的设备80可以以通用计算设备的形式表现,例如其可以为终端设备。混合排序推荐的设备80的组件可以包括但不限于:上述至少一个处理单元81、上述至少一个存储单元82、连接不同系统组件(包括存储单元82和处理单元81)的总线83。
总线83包括数据总线、地址总线和控制总线。
存储单元82可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)821和/或高速缓存存储器822,还可以进一步包括只读存储器(ROM)823。
存储单元82还可以包括具有一组(至少一个)程序模块824的程序/实用工具825,这样的程序模块824包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
混合排序推荐的设备80也可以与一个或多个外部设备84(例如键盘、指向设备等)通信,这种通信可以通过输入/输出(I/O)接口85进行。并且,混合排序推荐的设备80还可以通过网络适配器86与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器86通过总线83与混合排序推荐的设备80的其它模块通信。应当明白,尽管图中未示出,可以结合混合排序推荐的设备80使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
示例性程序产品
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在服务器设备上运行时,程序代码用于使服务器设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的推荐个数模型的训练装置中各模块的步骤,例如,服务器设备可以执行推荐个数模型的训练方法,包括:获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在服务器设备上运行时,程序代码用于使服务器设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的混合排序推荐的装置中各模块的步骤,例如,服务器设备可以执行混合排序推荐的方法,包括:接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于“示例性方法”中任一项所述推荐个数模型的训练方法训练得到的;根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
如图9所示,描述了根据本发明的实施方式的用于推荐个数模型的训练的程序产品90,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在服务器设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
如图10所示,描述了根据本发明的实施方式的用于混合排序推荐的程序产品100,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在服务器设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了系统的若干模块或子模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明系统各模块的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些操作,将多个操作合并为一个操作执行,和/或将一个操作分解为多个操作执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种推荐个数模型的训练方法,用于确定混合推荐列表中指定类型内容的推荐个数,其特征在于,包括:
获取基于混合推荐列表进行内容推荐时,用户对指定类型内容的行为反馈;
根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数;
对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
将提取的特征作为推荐个数模型的输入,以输出所述期望推荐个数为目标,调整所述推荐个数模型的参数。
2.根据权利要求1所述的方法,其特征在于,根据所述行为反馈及所述混合列表中指定类型内容的实际推荐个数,确定指定类型内容的期望推荐个数,包括:
确定用户点击所述指定类型内容的次数等于第一阈值时,将所述实际推荐个数作为期望推荐个数;
确定用户点击所述指定类型内容的次数大于第一阈值时,将所述实际推荐个数递增得到期望推荐个数;
确定用户点击所述指定类型内容的次数小于第一阈值时,将所述实际推荐个数递减得到期望推荐个数。
3.根据权利要求2所述的方法,其特征在于,所述提取的特征和对应的期望推荐个数为一个样本,调整所述推荐个数模型的参数之前,还包括:
获取包括多个样本的样本集;
确定样本集中用户点击所述指定类型内容的次数小于第一阈值,且所述实际推荐个数小于第二阈值的待筛选样本;
按设定比例筛选掉待筛选样本中的部分样本,得到更新的样本集。
4.根据权利要求1所述的方法,其特征在于,对所述用户的属性信息进行特征提取,包括:
对所述用户的性别、年龄、地理位置中至少一种进行特征提取。
5.根据权利要求1所述的方法,其特征在于,对所述内容推荐时用户所处的上下文信息进行特征提取,包括:
对所述内容推荐的时间、内容推荐时用户登录的客户端类型、内容推荐时客户端连接的网络类型中至少一种进行特征提取。
6.根据权利要求1所述的方法,其特征在于,对所述用户对指定类型内容的历史操作信息中至少一种进行特征提取,包括:
对不同历史时间窗口内,所述用户对指定类型内容的正向操作次数和/或负向操作次数进行特征提取。
7.根据权利要求1所述的方法,其特征在于,还包括:
在推荐个数模型的建模阶段,根据排序模型对不同类型内容的推荐程度评分,确定所述混合推荐列表中指定类型内容的实际推荐个数;
在推荐个数模型的更新阶段,利用所述推荐个数模型,确定所述混合推荐列表中指定类型内容的实际推荐个数。
8.一种混合排序推荐的方法,应用于推荐服务器,其特征在于,包括:
接收用户的推荐请求,获取所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种;
对所述用户的属性信息、内容推荐时用户所处的上下文信息和所述用户对指定类型内容的历史操作信息中至少一种进行特征提取;
将提取的特征输入到推荐个数模型,其中,所述推荐个数模型是基于权利要求1至7中任一项所述方法训练得到的;
根据所述推荐个数模型预测的推荐个数,及不同类型内容的推荐程度评分,得到不同类型内容混合排序的混合推荐列表并发送给所述用户。
9.一种推荐个数模型的训练设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述推荐个数模型的训练方法的步骤。
10.一种混合排序推荐的设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求8所述混合排序推荐的方法的步骤。
CN202110337819.7A 2021-03-30 2021-03-30 一种推荐个数模型的训练方法、混合内容推荐方法及装置 Pending CN112905896A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110337819.7A CN112905896A (zh) 2021-03-30 2021-03-30 一种推荐个数模型的训练方法、混合内容推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110337819.7A CN112905896A (zh) 2021-03-30 2021-03-30 一种推荐个数模型的训练方法、混合内容推荐方法及装置

Publications (1)

Publication Number Publication Date
CN112905896A true CN112905896A (zh) 2021-06-04

Family

ID=76109386

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110337819.7A Pending CN112905896A (zh) 2021-03-30 2021-03-30 一种推荐个数模型的训练方法、混合内容推荐方法及装置

Country Status (1)

Country Link
CN (1) CN112905896A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896475A (zh) * 2022-06-08 2022-08-12 北京达佳互联信息技术有限公司 媒介信息处理方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114896475A (zh) * 2022-06-08 2022-08-12 北京达佳互联信息技术有限公司 媒介信息处理方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109816039B (zh) 一种跨模态信息检索方法、装置和存储介质
EP3893154A1 (en) Recommendation model training method and related apparatus
CN111696112B (zh) 图像自动裁剪方法、系统、电子设备及存储介质
US20190362222A1 (en) Generating new machine learning models based on combinations of historical feature-extraction rules and historical machine-learning models
CN110390408B (zh) 交易对象预测方法和装置
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
CN111460384B (zh) 策略的评估方法、装置和设备
CN107766316B (zh) 评价数据的分析方法、装置及系统
CN111611085A (zh) 基于云边协同的人机混合增强智能系统、方法、装置
CN111797320A (zh) 数据处理方法、装置、设备及存储介质
CN112380104A (zh) 用户属性识别方法、装置、电子设备及存储介质
CN116541610A (zh) 一种推荐模型的训练方法及装置
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
EP3848818A1 (en) Method and apparatus for generating descriptions of video clips, electronic device, stroage medium, and computer program product
CN116362359A (zh) 基于ai大数据的用户满意度预测方法、装置、设备及介质
CN114187486A (zh) 模型训练方法及相关设备
CN112905896A (zh) 一种推荐个数模型的训练方法、混合内容推荐方法及装置
CN111797258B (zh) 基于美感评价的图像推送方法、系统、设备及存储介质
US20190205398A1 (en) Systems and methods for translation management
CN112364185A (zh) 多媒体资源的特征确定方法、装置、电子设备和存储介质
CN109948050B (zh) 信息处理方法和装置,存储介质和电子设备
US20210142213A1 (en) Data Partitioning with Quality Evaluation
CN111385659B (zh) 一种视频推荐方法、装置、设备及存储介质
CN116757270A (zh) 基于人机交互模型或大模型的数据处理方法、服务器
CN111161238A (zh) 图像质量评价方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination