CN115564517A - 商品推荐方法、预测模型训练方法和相关设备 - Google Patents

商品推荐方法、预测模型训练方法和相关设备 Download PDF

Info

Publication number
CN115564517A
CN115564517A CN202211172249.1A CN202211172249A CN115564517A CN 115564517 A CN115564517 A CN 115564517A CN 202211172249 A CN202211172249 A CN 202211172249A CN 115564517 A CN115564517 A CN 115564517A
Authority
CN
China
Prior art keywords
commodity
user
training
layer
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211172249.1A
Other languages
English (en)
Inventor
陈自强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Netease Zaigu Technology Co Ltd
Original Assignee
Hangzhou Netease Zaigu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Netease Zaigu Technology Co Ltd filed Critical Hangzhou Netease Zaigu Technology Co Ltd
Priority to CN202211172249.1A priority Critical patent/CN115564517A/zh
Publication of CN115564517A publication Critical patent/CN115564517A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开的实施方式提供了一种商品推荐方法,该包括:获取第一用户的基础信息、待推荐的各个第一商品的商品信息、第一用户与第二商品的历史交互信息;将基础信息、历史交互信息以及各个第一商品的商品信息输入至预测模型,得到第一用户对各个第一商品的第一预估交互概率以及第一预估交互次数;根据第一预估交互概率以及第一预估交互次数确定第一商品的推荐值;将满足预设条件的推荐值对应的第一商品,推送至目标终端,目标终端是与第一用户关联的终端。本公开中,针对用户进行个性化的商品推荐,保持了用户对商品的兴趣,从而提升了对用户的留存效果。此外,本公开还提供一种预测模型训练方法和相关设备。

Description

商品推荐方法、预测模型训练方法和相关设备
技术领域
本公开的实施方式涉及商品领域,更具体地,本公开的实施方式涉及商品推荐方法、预测模型训练方法和相关设备。
背景技术
本部分旨在为本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
在互联网时代,无论是电商行业,还是游戏等其他的领域,用户的留存率都是一个很重要指标。留存率用于衡量用户的活跃程度。若是用户的留存率较低,表示商品对用户的吸引力较低,导致用户可能流失。
示例性技术中,采用相关的措施(措施例如商品优惠券、营销短信等)进行干预,以提升用户的活跃度。
但干预措施往往是在发现用户的留存率较低的情况下实施的,此时,用户对于商品的兴趣较低,导致干预措施对用户的留存效果较低。
发明内容
本公开提供一种商品推荐方法、预测模型训练方法和相关设备,用以提升对用户的留存效果。
在本公开实施方式的第一方面中,提供一种商品推荐方法,包括:获取第一用户的基础信息、待推荐的各个第一商品的商品信息、所述第一用户与第二商品的历史交互信息;将所述基础信息、所述历史交互信息以及各个所述第一商品的商品信息输入至预测模型,得到所述第一用户对各个所述第一商品的第一预估交互概率以及第一预估交互次数;根据所述第一预估交互概率以及所述第一预估交互次数确定所述第一商品的推荐值;将满足预设条件的所述推荐值对应的第一商品,推送至目标终端,所述目标终端是与所述第一用户关联的终端。
在本公开的一实施例中,所述根据所述第一预估交互概率以及所述第一预估交互次数确定所述第一商品的推荐值,包括:
对所述第一预估交互概率以及所述第一预估交互次数进行数量级转换,其中,数量级转换后的所述第一预估交互概率与数量级转换后的所述第一预估交互次数所对应的数量级相同;
根据数量级转换后的第一预估交互概率、数量级转换后的第一预估交互次数、所述第一预估交互概率对应的权重、以及所述第一预估交互次数对应的权重,确定所述第一商品的推荐值。
在本公开实施方式的第二方面中,提供一种预测模型训练方法,包括:
获取各个训练样本,所述训练样本包括第三商品的商品信息、第二用户的基础信息、所述第二用户与第四商品的历史交互信息;
根据各个所述训练样本对预设模型进行训练得到预测模型,所述预测模型用于预测第一用户对各个第一商品的第一预估交互概率以及第一预估交互次数,所述第一预估交互概率以及所述第一预估交互次数用于确定所述第一用户待推送的第一商品。
在本公开的一实施例中,所述预设模型的网络结构包括输入层、嵌入向量层、注意力层、多门控混合专家网络层、特征交叉层、任务塔层以及输出层,所述输入层连接所述嵌入向量层,所述嵌入向量层连接所述注意力层、所述多门控混合专家网络层以及特征交叉层,所述注意力层连接所述多门控混合专家网络层,所述多门控混合专家网络层以及特征交叉层连接所述任务塔层,所述任务塔层连接所述输出层。
在本公开的另一实施例中,所述网络结构还包括偏置网络层,所述偏置网络层连接所述嵌入向量层以及所述输出层,所述偏置网络层的输出结果用于与所述任务塔层的输出结果构成所述输出层的最终输出结果。
在本公开的另一实施例中,所述根据各个所述训练样本对预设模型进行训练得到预测模型,包括:
获取所述预设模型对所述训练样本的第二预估交互概率以及第二预估交互次数;
根据所述训练样本的输入特征、所述训练样本的标签值、所述第二预估交互概率、所述第二预估交互次数、所述第二预估交互概率对应的权重以及所述第二预估交互次数对应的权重,更新所述预设模型的目标损失函数;
响应于更新后的目标损失函数满足预设条件,停止对所述预设模型进行训练,以得到预测模型。
在本公开的另一实施例中,所述根据各个所述训练样本对预设模型进行训练得到预测模型,包括:
根据各个所述训练样本得到训练数据集、验证数据集以及测试数据集;
根据所述训练数据集中的各个训练样本对所述预设模型进行训练,得到待调整模型;
根据所述验证数据集中的各个训练样本对所述待调整模型进行训练,得到待确定模型,所述验证数据集中的各个训练样本用于对所述待调整模型的网络参数进行调整;
根据所述测试集数据中的各个训练样本对所述待确定模型进行训练,得到所述待确定模型的性能参数;
响应于所述性能参数满足设定条件,将所述待确定模型确定为所述预测模型。
在本公开的另一实施例中,所述训练样本包括正样本以及负样本,所述正样本的标签用于指示所述第二用户点击所述第三商品,所述负样本的标签用于指示所述第二用户未点击所述第三商品。
在本公开实施方式的第三方面中,提供一种商品推荐装置,包括:
第一获取模块,用于获取第一用户的基础信息、待推荐的各个第一商品的商品信息、所述第一用户与第二商品的历史交互信息;
输入模块,用于将所述基础信息、所述历史交互信息以及各个所述第一商品的商品信息输入至预测模型,得到所述第一用户对各个所述第一商品的预估交互概率以及预估交互次数;
确定模块,用于根据所述预估交互概率以及所述预估交互次数确定所述第一商品的推荐值;
推送模块,用于将满足预设条件的所述推荐值对应的第一商品,推送至目标终端,所述目标终端是与所述第一用户关联的终端。
在本公开的一实施例中,所述确定模块包括:
转换单元,用于对所述第一预估交互概率以及所述第一预估交互次数进行数量级转换,其中,数量级转换后的所述第一预估交互概率与数量级转换后的所述第一预估交互次数所对应的数量级相同;
第一确定单元,用于根据数量级转换后的第一预估交互概率、数量级转换后的第一预估交互次数、所述第一预估交互概率对应的权重、以及所述第一预估交互次数对应的权重,确定所述第一商品的推荐值。
在本公开实施方式的第四方面中,提供一种预测模型训练装置,包括:
第二获取模块,用于获取各个训练样本,所述训练样本包括第三商品的商品信息、第二用户的基础信息、所述第二用户与第四商品的历史交互信息;
训练模块,用于根据各个所述训练样本对预设模型进行训练得到预测模型,所述预测模型用于预测第一用户对各个第一商品的预估交互概率以及预估交互次数,所述预估交互概率以及所述预估交互概率用于确定所述第一用户待推送的第二商品。
在本公开的一实施例中,所述预设模型的网络结构包括输入层、嵌入向量层、注意力层、多门控混合专家网络层、特征交叉层、任务塔层以及输出层,所述输入层连接所述嵌入向量层,所述嵌入向量层连接所述注意力层、所述多门控混合专家网络层以及特征交叉层,所述注意力层连接所述多门控混合专家网络层,所述多门控混合专家网络层以及特征交叉层连接所述任务塔层,所述任务塔层连接所述输出层。
在本公开的另一实施例中,所述网络结构还包括偏置网络层,所述偏置网络层连接所述嵌入向量层以及所述输出层,所述偏置网络层的输出结果用于与所述任务塔层的输出结果构成所述输出层的最终输出结果。
在本公开的另一实施例中,所述训练模块,包括:
第一获取单元,用于获取所述预设模型对所述训练样本的第二预估交互概率以及第二预估交互次数;
更新单元,用于根据所述训练样本的输入特征、所述训练样本的标签值、所述第二预估交互概率、所述第二预估交互次数、所述第二预估交互概率对应的权重以及所述第二预估交互次数对应的权重,更新所述预设模型的目标损失函数;
第一训练单元,用于响应于更新后的目标损失函数满足预设条件,停止对所述预设模型进行训练,以得到预测模型。
在本公开的另一实施例中,所述训练模块,包括:
第二获取单元,用于根据各个所述训练样本得到训练数据集、验证数据集以及测试数据集;
第二训练单元,用于根据所述训练数据集中的各个训练样本对所述预设模型进行训练,得到待调整模型;
所述第二训练单元,还用于根据所述验证数据集中的各个训练样本对所述待调整模型进行训练,得到待确定模型,所述验证数据集中的各个训练样本用于对所述待调整模型的网络参数进行调整;
所述第二训练单元,还用于根据所述测试集数据中的各个训练样本对所述待确定模型进行训练,得到所述待确定模型的性能参数;
第二确定单元,用于响应于所述性能参数满足设定条件,将所述待确定模型确定为所述预测模型。
在本公开的另一实施例中,所述训练样本包括正样本以及负样本,所述正样本的标签用于指示所述第二用户点击所述第三商品,所述负样本的标签用于指示所述第二用户未点击所述第三商品。
在本公开实施方式的第五方面中,提供一种介质,包括:计算机执行指令,所述计算机执行指令被处理器执行时用于实现如上所述的商品推荐方法或如上所述的预测模型训练方法。
在本公开实施方式的第六方面中,提供一种计算设备,包括:
存储器以及处理器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如上所述的商品推荐方法或如上所述的预测模型训练方法。
本公开实施方式中,通过预测用户对各个商品的交互概率以及交互次数来确定商品的推荐值,从而基于推荐值确定用户感兴趣的商品,再将用户感兴趣的商品推送至用户,也即针对用户进行个性化的商品推荐,保持了用户对商品的兴趣,从而提升了对用户的留存效果。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性地示出了根据本公开实施方式的音频播放方法应用场景示意图;
图2示意性地示出了根据本公开商品推荐方法一实施例的流程示意图;
图3示意性地示出了根据本公开商品推荐方法另一实施例的流程示意图;
图4示意性地示出了根据本公开预测模型训练方法一实施例的流程示意图;
图5示意性地示出了本公开涉及的预测模型的训练示意图;
图6示意性地示出了根据本公开另一实施例的流程示意图;
图7示意性地示出了根据本公开实施例提供的程序产品的示意图;
图8示意性地示出了根据本公开实施例提供的商品推荐装置的结构示意图;
图9示意性地示出了根据本公开实施例提供的预测模型训练装置的结构示意图;
图10示意性地示出了根据本公开实施例提供的计算设备的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本公开的实施方式,提出了一种商品推荐方法、预测模型训练方法和相关设备。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名
另外,本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据,对数据的采集、传播、使用等,均符合国家相关法律法规要求,本公开实施方式/实施例可以互相组合。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
发明概述
在互联网时代,无论是电商行业,还是游戏等其他的领域,用户的留存率都是一个很重要指标。留存率用于衡量用户的活跃程度。若是用户的留存率较低,表示商品对用户的吸引力较低,导致用户可能流失。
本专利发明人发现,现有留存率提升相关技术方案主要是以留存率预估建模+人群干预两阶段为主,第一阶段是基于用户的留存信息进行建模,并采用建模的模型预测得到待检测的用户的留存率;第二阶段基于预测的用户留存概率圈定即将流失的用户群体,并采取相关措施(如优惠券、营销短信等)进行干预,以提升留存率。但此种方式存在如下缺点:
1、整个流程需要多方人员协同配合,多方人员例如为配置优惠券或营销短信的人员、建模人员、模型应用人员等;
2、当用户留存率较低时,往往需要较大的激励才能触动用户留存,成本较高,较大的激励例如为高额的优惠券;
3、用户留存率较小时,才能干预用户以挽留用户,挽留效果不明显,也即挽留方案存在滞后性;
4、现有的用户留存率提升方案只针对用户群体进行干预,无法做到用户粒度的个性化留存率的提升,粒度较粗。
本专利发明人因此想到,通过预测用户对各个商品的交互概率以及交互次数来确定商品的推荐值,从而基于推荐值确定用户感兴趣的商品,再将用户感兴趣的商品推送至用户,也即针对用户进行个性化的商品推荐,保持了用户对商品的兴趣,从而保证了用户的留存率不会过低,且保证了对用户的挽留效果,并避免后续采用较大的激励机制提升用户的留存率,降低了留存率提升的成本。此外,还省去了为用户配置挽留方案,从而节省了用户留存率的流程节点。
应用场景总览
首先参考图1,图1为本公开实施方式的商品推荐方法的应用场景示意图。商品推荐装置100获取用户的基础信息、待推荐的各个第一商品的商品信息、以及用户与第二商品的历史交互信息。商品推荐装置100将基础信息、历史交互信息以及各个第一商品的商品信息输入至预测模型200,即可得到第一用户对各个第一商品的预估交互概率以及预估交互次数。通过预估交互次数以及预估交互概率可以得到各个第一商品的推荐值,再将满足预设条件的推荐值的第一商品的商品信息推送至用户关联的终端300。
示例性方法
下面结合图1的应用场景,参考图2-图3来描述根据本公开示例性实施方式的商品推荐方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
示例性的,本公开的实施例涉及的商品推荐装置可以是任意具备数据处理能力的设备,例如,商品推荐装置可为计算机、服务器等。
参照图2,图2示例性的示出了根据本公开实施例提供的商品推荐方法一实施例的流程示意图,商品推荐方法包括:
步骤S201,获取第一用户的基础信息、待推荐的各个第一商品的商品信息、第一用户与第二商品的历史交互信息。
在本实施例中,执行主体为商品推荐装置,为了描述,以下采用第一装置指代商品推荐装置。
第一装置从日志数据库中调取日志,日志记录了用户正在进行商品的浏览,装置基于日志记录的数量确定获取需要进行商品推荐的用户,该用户定义为第一用户。
第一装置在确定第一用户后,获取第一用户的基础信息。基础信息包括第一用户的年龄、地域、性别等信息,通过基础信息可以便于第一装置为第一用户定制个性化的商品推荐。第一装置可以从服务器中获取第一用户的注册信息,注册信息中包括有第一用户的基础信息。
第一装置再确定待推荐的各个第一商品。在一示例中,各个第一商品可以是基于第一用户浏览商品的记录中确定,也可以是当前热度高的商品。在另一示例中,第一装置在检测到第一用户正在进行商品交互,获取交互商品所在的item(商品目录),item中未被交互的商品即可被确定为第一商品。
第一装置再获取各个第一商品的商品信息,商品信息包括价格、类型、季节性、文本描述以及图像等。季节性例如为商品适用的季节。
第一装置还需要获取第一用户与第二商品的历史交互信息。第二商品指的是用户已浏览或者已购买的商品,历史交互信息可以包括对第二商品的点击行为、加入购物车的行为、收藏行为、分享行为、购买行为等。
步骤S202,将基础信息、历史交互信息以及各个第一商品的商品信息输入至预测模型,得到第一用户对各个第一商品的第一预估交互概率以及第一预估交互次数。
第一装置可以将基础信息、历史交互信息以及各个第一商品的商品信息输入至预测模型。预测模型可以是CNN(Convolutional Neural Networks,卷积神经网络)模型,预测模型用于预测第一用户对各个第一商品的预估交互概率以及预估交互次数。
预估交互概率指的是CTR(Click-Through-Rate,点击通过率),CTR是互联网广告、推荐、搜索业务中常用的术语,指的是网络广告或者商品的点击到达率,即该商品的实际点击次数除以商品的展示量。
预估交互次数指的是用户在一定时长内进行交互的商品的数量,一定时长可以是一个会话Session。Session指的是用户在应用程序或者网站上一次登入与一次登出的时间单位。预估交互次数可以视为Session长度,也即Session长度是用户在一定时长内进行交互的商品的数量。
步骤S203,根据第一预估交互概率以及第一预估交互次数确定第一商品的推荐值。
第一装置在得到各个第一商品对应的第一预估交互概率以及第一预估交互次数,即可通过第一预估交互概率以及第一预估交互次数确定第一商品对第一用户的推荐值。
在一示例中,第一装置可以通过乘法融合方法对第一预估交互概率以及第一预估交互次数进行融合得到推荐值。乘法融合方法例如指数加法融合,具体的推荐值=factor_1*(\alpha_1+score_1)^{\beta_1}+factor_2*(\alpha_2+score_2)^{\beta_2}。其中,score_1为第一预估交互概率,\alpha_1和{\beta_1}为score_1的调节参数,factor_1为score_1的权重;score_2为第一预估交互次数,\alpha_2和{\beta_2}为score_2的调节参数,factor_2为score_2的权重。\alpha_1、{\beta_1}、\alpha_2和{\beta_2}可以预先设置。
在一示例中,第一装置可以通过加法融合方法对第一预估交互概率以及第一预估交互次数进行融合得到推荐值,也即直接将第一预估交互概率与第一预估交互次数相加得到推荐值。
步骤S204,将满足预设条件的推荐值对应的第一商品,推送至目标终端,目标终端是与第一用户关联的终端。
通过上述方法,第一装置可以得到每个第一商品所对应的推荐值。第一装置再对各个推荐值进行排序,从而基于排序的各个推荐值确定满足预设条件的推荐值。
在一示例中,第一装置可以按照从大到小的顺序对各个推荐值进行排序,第一装置将排序在最前的推荐值确定为满足预设条件的推荐值,或者第一装置将前序在前N的推荐值作为满足预设条件的推荐值。
第一装置将满足条件的推荐值所对应的第一商品推送至目标终端,目标终端是与第一用户关联的终端,也即将第一商品的商品信息推送至第一用户关联的终端。
在互联网电商场景下,用户留存通常包括「拉新」、「用户活跃」、「用户召回」三个阶段,其中「用户活跃」阶段可以通过商品推荐实现促活(即推荐更高质量、体验更好的商品,用户活跃度更高,留存率相对也更高)。通过数据分析发现,用户的浏览session长度与其留存率呈现正相关关系,也即用户在当前session(会话)中商品交互行为次数越多,其次日/次周留存率越高。基于此,本实施例中,第一装置将第一商品信息推送至终端,也即使得第一用户对推荐的第一商品产生更长的session,从而使得第一用户产生交互更长的session,可以理解的是,通过将第一商品推荐给用户,能够提升第一用户在商品页面的停留时长,从而起到提升用户留存率的作用。
在本实施例中,通过预测用户对各个商品的交互概率以及交互次数来确定商品的推荐值,从而基于推荐值确定用户感兴趣的商品,再将用户感兴趣的商品推送至用户,也即针对用户进行个性化的商品推荐,保持了用户对商品的兴趣,从而提升了对用户的留存效果。
参照图3,图3示例性的示出了根据本公开实施例提供的商品推荐方法另一实施例的流程示意图,基于图2所示的实施例,步骤S203包括:
步骤S301,对第一预估交互概率以及第一预估交互次数进行数量级转换,其中,数量级转换后的第一预估交互概率与数量级转换后的第一预估交互次数所对应的数量级相同。
在本实施例中,第一预估交互概率以及第一预估交互次数不是相同的量级。例如,第一预估交互概率为0.01,而第一预估交互次数是1.2。若是采用加权计算得到推荐值,由于第一预估交互概率的量级小于第一预估交互次数的量级,推荐值的大小由第一预估交互次数决定。
在一示例中,第一装置对第一预估交互概率以及第一预估交互次数进行数量级转换,数量级转换后的第一预估交互概率与数值狡猾后的第一预估交互次数所对应的数量级相同,例如,第一预估交互概率为0.01,而第一预估交互次数是1.2,则将第一预估交互概率由0.01转换为1。
在另一示例中,可以在进行推荐值的计算时,将两者进行数量级转换。具体的,推荐值=factor_1*(\alpha_1+score_1)^{\beta_1}+factor_2*(\alpha_2+score_2)^{\beta_2},也即通过指数{\beta_1}以及{\beta_2},调整两者的量级,使得两者所对应的数量级相同。
步骤S302,根据数量级转换后的第一预估交互概率、数量级转换后的第一预估交互次数、第一预估交互概率对应的权重、以及第一预估交互次数对应的权重,确定第一商品的推荐值。
第一装置基于数量级转换后的第一预估交互概率、数量级转换后的第一预估交互次数、第一预估交互概率对应的权重以及第一预估交互次数对应的权重,加权计算得到第一商品的推荐值。
在本实施例中,通过将预估交互概率与预估交互次数进行数量级转换,使得两者所对应的数量级相同,从而使得第一商品的推荐值不会由其中一个参数确定,准确的确定了为用户推荐的商品。
本公开还提供一种预测模型训练方法。
参照图4,图4示例性的示出了根据本公开实施例提供的预测模型训练方法一实施例的流程示意图,该方法包括:
步骤S401,获取各个训练样本,训练样本包括第三商品的商品信息、第二用户的基础信息、第二用户与第四商品的历史交互信息。
在本实施例中,执行主体为预测模型训练装置,为了便于描述,以下采用第二装置指代预测模型训练装置。第二装置可以是服务器等大型算力的设备。
经数据分析发现,用户在会话内的交互商品的数量与用户留存率呈正相关关系,也即用户在一个会话内交互的商量的数量越多,该用户的留存率越大。此外,CTR与用户留存率也是呈正相关关系。基于此,第二装置训练出能够预测商品的预估交互概率和预估交互次数的预测模型。
为了训练预测模型,装置需要获取多个训练样本,训练样本包括第三商品的商品信息、第二用户的基础信息、第二用户与第四商品的历史交互信息。商品信息包括第三商品的价格、类型、季节性、文本描述以及图像等。季节性例如为商品适用的季节。历史交互信息可以包括对第四商品的点击行为、加入购物车的行为、收藏行为、分享行为、购买行为等。基础信息包括第二用户的年龄、地域、性别等信息。
具体的,第二装置先收集第二用户所对应的信息,并对信息进行处理。处理包括数据清洗、数据转换、数据标准化、缺失值处理以及特征提取等,第二装置再基于处理后的数据得到训练样本。第三商品是推荐给第二用户的商品,若是用户与第三商品进行交互,则训练样本对应的标签的值是1;若用户与第三商品未进行交互,则训练样本对应的标签的值是0。可以理解的是,训练样本包括正样本以及负样本,正样本的标签用于指示第二用户点击第三商品,也即正样本的标签的值是1;负样本的标签用于指示第二用户未点击第三商品,也即负样本的标签的值是0。
步骤S402,根据各个训练样本对预设模型进行训练得到预测模型,预测模型用于预测第一用户对各个第一商品的第一预估交互概率以及第一预估交互次数,第一预估交互概率以及第一预估交互次数用于确定第一用户待推送的第一商品。
第二装置在得到训练样本后,即可通过训练样本对预设模型进行训练得到预测模型。预测模型用于预测第一用户对各个第一商品的第一预估交互概率和第一预估交互次数,第一预估交互概率以及第一预估交互次数用于确定第一用户待推送的第一商品,具体参照上述描述,在此不再进行赘述。
本实施例中,将留存率模型建模和推荐模型建模联合考虑,也即将传统两阶段留存率提升方法缩减为训练预测模型一个步骤,能够更及时、更高效、费用更低,同时也更加个性化地提升用户留存率。
在一实施例中,需要对预设模型搭建。预设模型的网络结构包括输入层、嵌入向量层、注意力层、多门控混合专家网络层、特征交叉层、任务塔层以及输出层。
设置预设模型的网络结构;
其中,预设模型的网络结构包括输入层、嵌入向量层、注意力层、多门控混合专家网络层、特征交叉层、任务塔层以及输出层,输入层连接嵌入向量层,嵌入向量层连接注意力层、多门控混合专家网络层以及特征交叉层,注意力层连接多门控混合专家网络层,多门控混合专家网络层以及特征交叉层连接任务塔层,任务塔层连接输出层。
输入层包括稀疏特征和数值特征两大类特征输入层。输入层可进一步分为用户属性特征、上下文特征、用户序列行为特征、候选商品特征(Candidate以及偏差特征等输入层。用户属性特征通过用户的基础信息提取特征得到,用户属性例如为年龄、性别、职业等。上下文特征以及用户序列行为特征通过历史交互信息提取得到,上下文特征指的是用户浏览商品的上下文,而用户序列行为特征指的是用户进行商品交互的具体行为,例如收藏行为、购买行为、支付行为等。候选商品特征从商品信息提取特征得到,候选商品特征例如为第一商品的价格、类型等。偏差特征指的是数值上的偏差,例如,商品价格偏差,价格偏差例如为第一商品的价格和第二商品的价格之间的差值。
嵌入向量层:主要对输入的稀疏特征进行嵌入,转换为稠密的数值特征向量。稀疏特征指的是不具备具体数值的特征,例如,商品的类型没有具体的数值,则为稀疏特征。也即嵌入向量层将稀疏特征转换成具有数值的特征。
注意力层:利用候选商品特征对用户历史行为序列进行注意力操作,主要作用是激活用户历史兴趣,表达用户历史多峰兴趣。
多门控混合专家网络层:使用了多个专家网络,针对不同任务,通过任务特有的门控网络组合不同专家网络。
特征交叉层,对底层输入特征进行交叉,交叉方式可能包括DCN(Deep CrossNetwork,深交叉网络)者FM(Factorization Machine,因子分解机)等。
任务塔层:该层输入为多门控混合专家网络输出和特征交叉层输出的拼接,结构上通常采用多层DNN(Deep Neural Networks,全连接神经网络),针对特定任务进行预测。
输出层:该层在任务塔网络输出的基础上,加上偏置网络的结果,作为最终的输出。需要注意的是,只在训练或者验证的时候,加上偏置网络的结果,而在线上推断时不加。
进一步的,预设模型的网络结构还包括偏置网络层,偏置网络层连接嵌入向量层以及输出层,且偏置网络层的输出结果用于与任务塔层的输出结果构成输出层的最终结果。
对于任务K的预测值Yk为:
yk=hk(concat([fk(x),m(x)]))+k(x),
Figure BDA0003863682270000141
其中,f^k(x)是多门控混合专家网络层的输出,是多个专家网络的混合加权输出,权重由门控函数确定,即g^k(x)=softmax(W_{gk}x);m(x)是特征交叉的输出,对底层特征进行高层次交叉;k(x)是偏置网络层的输出,用于偏差纠正,如位置偏差等因素可能对模型预测产生负向影响;h(x)是任务塔层的输出,任务塔层针对特定的任务,根据注意力层和特征交叉层的输出,得到特定任务的输出。
参照图5,对预设模型的训练过程进行简要说明。
1、用户属性特征(User Profile Features)、上下文特征(Context Features)、用户序列行为特征(User Behavior Sequence)、候选商品特征(Candidate Item Features)以及偏差特征(Bias Features)通过输入层输入至嵌入向量层Embedding Layer;
2、嵌入向量层对用户属性特征(User Profile Features)、上下文特征(ContextFeatures)、候选商品特征(Candidate Item Features)进行嵌入,并将其转化为稠密的向量特征;
3、嵌入向量层将用户序列行为特征(User Behavior Sequence)输入至注意力层,使得注意力层基于候选商品特征(Candidate Item Features)对用户序列行为特征(UserBehavior Sequence)进行attention等注意力操作,再进行sum pooling(池化);
4、用户属性特征(User Profile Features)、上下文特征(Context Features)、候选商品特征(Candidate Item Features)转化后进行联合(concat),且结合sum pooling后的用户序列行为特征输入至多门控混合专家网络层以及特征交叉层Feature Interact;
5、多门控混合专家网络层包括门控网络(Gate Net)和多个专家网络,专家网络例如为Expert1、Expert2、…Expert K,门控网络针对不同的任务配置相应的专家网络,任务例如为确定预估交互概率和预估交互次数;
6、特征交叉层对输入的特征进行交叉;
7、特征交叉层以及多门控混合专家网络层的输出进行联合(concat)后,输入至Task1(任务1)对应的任务塔层以及Task2(任务2)对应的任务塔层,任务塔包括多个DNN;
8、偏置网络层基于嵌入向量层输入的偏差特征得到偏置结果,一个任务塔的输出结果+偏置结果得到最终输出结果Task1,另一个任务塔的输出结果+偏置结果得到最终输出结果Task2,Task1+Task2由输出层输出。
在本实施例中,第二装置搭建预设模型的网络结构,使得搭建网络结构的预设模型能够训练出能够预测出预估交互概率以及预估交互次数的预测模型。
参照图6,图6示例性的示出了根据本公开实施例提供的预测模型训练方法又一实施例的流程示意图,基于图4或5所示的实施例,步骤S402包括:
步骤S601,获取预设模型对训练样本的第二预估交互概率以及第二预估交互次数。
步骤S602,根据训练样本的输入特征、训练样本的标签值、第二预估交互概率、第二预估交互次数、第二预估交互概率对应的权重以及第二预估交互次数对应的权重,更新预设模型的目标损失函数。
在本实施例中,预测模型需要输出两个值,一个是预估交互概率,另一个是预估交互次数,因此,预设模型需要设置两个损失函数,一个损失函数对应预估交互概率,另一个损失函数对应预估交互次数。
预估交互概率对应的第一损失函数可以使用二分类交叉熵作为损失函数,预估交互次数对应的第一损失函数可以使用平均平方误差损失函数。在训练过程中,可以对第一损失函数以及第二损失函数做回归处理,再将归回处理后的第一损失函数以及第二损失函数加权求和以更新目标损失函数。
在一示例中,目标损失函数的表达式为:
Figure BDA0003863682270000161
其中,xi为训练样本i的输入特征,yi为训练样本i的标签,训练样本中的第三商品被交互,标签的值为1,第三商品未被交互,标签的值为0;zi为用户实际交互次数;p_{ctr}(x_i,\theta)为模型输出的第二预估交互概率,f_{session}(x_i,\theta)为模型输出的第二预估交互次数,\theta为模型参数,w_1、w_2分别为第一损失函数以及第二损失函数对应的损失权重。
对此,获取预设模型输出的训练样本的第二预估交互概率以及第二预估交互次数,再通过训练样本的输入特征、训练样本的标签值、第二预估交互概率、第二预估交互次数、第二预估交互概率对应的权重以及第二预估交互次数对应的权重,更新预设模型的目标损失函数。
步骤S603,响应于更新后的目标损失函数满足预设条件,停止对预设模型进行训练,以得到预测模型。
在得到目标损失函数后,判断目标损失函数是否满足预设条件。若是目标损失函数满足预设条件,则停止对预设模型进行训练,从而得到预测模型。若是目标损失函数不满足预设条件,则继续采用训练样本对预测模型进行训练,也即重复步骤S701以及步骤S702,直至目标损失函数满足预设条件。
在一示例中,若是目标损失函数不在收敛,即可确定目标损失函数满足预设条件。
在另一示例中,若是目标损失函数的变化量小于预设变化量,则可确定目标损失函数满足预设条件。
在本实施例中,第二装置通过设置预估交互概率以及预估交互次数对应的损失函数,从而训练出能够用于提高用户留存率的预测模型。
在一实施例中,为了准确训练及评估预测模型的效果,将各个训练样本进行划分得到训练数据集、验证数据集以及测试数据集。数据集的划分可以是按照时间节点划分,例如,各个训练样本是8天内的数据,则前7天的数据按照指定比例(指定比例例如为9:1或8:2)划分为训练数据集和验证数据集,最后1天作为测试数据集。
训练数据集用来训练模型,验证数据集中的各个训练样本用来进行模型网络参数的调优,调优例如为调节多门控混合专家网络层中专家个数、专家网络层数、交互概率和交互次数的权重参数、训练迭代次数等。测试数据集用来最终评估预测模型的效果。对于交互概率,采用ROC(receiver operating characteristic,接受者操作特性曲线)曲线下与坐标轴围成的面积评估;对于交互次数,采用平均平方误差评估。
基于上述的数据集,第二装置根据训练数据集中的各个训练样本对预设模型进行训练,得到待调整模型;根据验证数据集中的各个训练样本对待调整模型进行训练,得到待确定模型;第二装置再根据测试集数据中的各个训练样本对待确定模型进行训练,得到待确定模型的性能参数;响应于性能参数满足设定条件,将待确定模型确定为预测模型。性能参数即为模型的训练后的参数,设定条件通过上述的“面积”以及“平均平方误差”确定。
在本实施例中,通过将训练样本分为多个数据集,在训练得到预测模型后,对预测模型进行性能调优,并对调优后的模型进行测试,从而得到预测准确度高的预测模型。
示例性介质
在介绍了本公开示例性实施方式的方法之后,接下来,参考图7对本公开示例性实施方式的存储介质进行说明。
参考图7所示,存储介质70中存储着根据本公开的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括计算机执行指令,该计算机执行指令用于使计算设备执行本公开所提供的商品推荐方法。然而,本公开的程序产品不限于此。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机执行指令。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的计算机执行指令,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。计算机执行指令可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备。
示例性装置
在介绍了本公开示例性实施方式的介质之后,接下来,参考图9对本公开示例性实施方式的商品推荐装置进行说明,商品推荐装置用于实现上述任一商品推荐方法实施例中的方法,其实现原理和技术效果类似。
参考图8,图8示意性地示出了根据本公开实施例提供的商品推荐装置的结构示意图。
如图8所示,商品推荐装置包括:第一获取模块810,用于获取第一用户的基础信息、待推荐的各个第一商品的商品信息、第一用户与第二商品的历史交互信息;输入模块820,用于将基础信息、历史交互信息以及各个第一商品的商品信息输入至预测模型,得到第一用户对各个第一商品的预估交互概率以及预估交互次数;确定模块830,用于根据预估交互概率以及预估交互次数确定第一商品的推荐值;推送模块840,用于将满足预设条件的推荐值对应的第一商品,推送至目标终端,目标终端是与第一用户关联的终端。
在本公开一实施例中,还包括:确定模块830包括:转换单元,用于对第一预估交互概率以及第一预估交互次数进行数量级转换,其中,数量级转换后的第一预估交互概率与数量级转换后的第一预估交互次数所对应的数量级相同;第一确定单元,用于根据数量级转换后的第一预估交互概率、数量级转换后的第一预估交互次数、第一预估交互概率对应的权重、以及第一预估交互次数对应的权重,确定第一商品的推荐值。
在介绍了本公开示例性实施方式的介质之后,接下来,参考图10对本公开示例性实施方式的预测模型训练装置进行说明,商品推荐装置用于实现上述任一预测模型训练方法实施例中的方法,其实现原理和技术效果类似。
参考图9,图9示意性地示出了根据本公开实施例提供的预测模型训练装置的结构示意图。
如图9所示,预测模型训练装置包括:第二获取模块99,用于获取各个训练样本,训练样本包括第三商品的商品信息、第二用户的基础信息、第二用户与第四商品的历史交互信息;训练模块920,用于根据各个训练样本对预设模型进行训练得到预测模型,预测模型用于预测第一用户对各个第一商品的预估交互概率以及预估交互次数,预估交互概率以及预估交互概率用于确定第一用户待推送的第二商品。
在一实施例中,预设模型的网络结构包括输入层、嵌入向量层、注意力层、多门控混合专家网络层、特征交叉层、任务塔层以及输出层,输入层连接嵌入向量层,嵌入向量层连接注意力层、多门控混合专家网络层以及特征交叉层,注意力层连接多门控混合专家网络层,多门控混合专家网络层以及特征交叉层连接任务塔层,任务塔层连接输出层。
在另一实施例中,网络结构还包括偏置网络层,偏置网络层连接嵌入向量层以及输出层,偏置网络层的输出结果用于与任务塔层的输出结果构成输出层的最终输出结果。
在另一实施例中,训练模块,包括:第一获取单元,用于获取预设模型对训练样本的第二预估交互概率以及第二预估交互次数;更新单元,用于根据训练样本的输入特征、训练样本的标签值、第二预估交互概率、第二预估交互次数、第二预估交互概率对应的权重以及第二预估交互次数对应的权重,更新预设模型的目标损失函数;第一训练单元,用于响应于更新后的目标损失函数满足预设条件,停止对预设模型进行训练,以得到预测模型。
在另一实施例中,训练模块,包括:第二获取单元,用于根据各个训练样本得到训练数据集、验证数据集以及测试数据集;第二训练单元,用于根据训练数据集中的各个训练样本对预设模型进行训练,得到待调整模型;第二训练单元,还用于根据验证数据集中的各个训练样本对待调整模型进行训练,得到待确定模型,验证数据集中的各个训练样本用于对待调整模型的网络参数进行调整;第二训练单元,还用于根据测试集数据中的各个训练样本对待确定模型进行训练,得到待确定模型的性能参数;第二确定单元,用于响应于性能参数满足设定条件,将待确定模型确定为预测模型。
在另一实施例中,训练样本包括正样本以及负样本,正样本的标签用于指示第二用户点击第三商品,负样本的标签用于指示第二用户未点击第三商品。
示例性计算设备
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图10对本公开示例性实施方式的计算设备进行说明。
图10显示的计算设备100仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。如图10所示,计算设备100以通用计算设备的形式表现。计算设备100的组件可以包括但不限于:至少一个处理单元1001、至少一个存储单元1002,连接不同系统组件(包括处理单元1001和存储单元1002)的总线1003。其中,至少一个存储单元1002中存储有计算机执行指令;至少一个处理单元1001包括处理器,处理器执行该计算机执行指令,以实现上文描述的方法。
总线1003包括数据总线、控制总线和地址总线。
存储单元1002可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)10021和/或高速缓存存储器10022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(ROM)10023。
存储单元1002还可以包括具有一组(至少一个)程序模块10024的程序/实用工具10025,这样的程序模块10024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备100也可以与一个或多个外部设备1004(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口1005进行。并且,计算设备100还可以通过网络适配器1006与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图10所示,网络适配器1006通过总线1003与计算设备100的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备100使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了商品推荐装置/预测模型训练装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种商品推荐方法,其特征在于,包括:
获取第一用户的基础信息、待推荐的各个第一商品的商品信息、所述第一用户与第二商品的历史交互信息;
将所述基础信息、所述历史交互信息以及各个所述第一商品的商品信息输入至预测模型,得到所述第一用户对各个所述第一商品的第一预估交互概率以及第一预估交互次数;
根据所述第一预估交互概率以及所述第一预估交互次数确定所述第一商品的推荐值;
将满足预设条件的所述推荐值对应的第一商品,推送至目标终端,所述目标终端是与所述第一用户关联的终端。
2.根据权利要求1所述的商品推荐方法,其特征在于,所述根据所述第一预估交互概率以及所述第一预估交互次数确定所述第一商品的推荐值,包括:
对所述第一预估交互概率以及所述第一预估交互次数进行数量级转换,其中,数量级转换后的所述第一预估交互概率与数量级转换后的所述第一预估交互次数所对应的数量级相同;
根据数量级转换后的第一预估交互概率、数量级转换后的第一预估交互次数、所述第一预估交互概率对应的权重、以及所述第一预估交互次数对应的权重,确定所述第一商品的推荐值。
3.一种预测模型训练方法,其特征在于,包括:
获取各个训练样本,所述训练样本包括第三商品的商品信息、第二用户的基础信息、所述第二用户与第四商品的历史交互信息;
根据各个所述训练样本对预设模型进行训练得到预测模型,所述预测模型用于预测第一用户对各个第一商品的第一预估交互概率以及第一预估交互次数,所述第一预估交互概率以及所述第一预估交互次数用于确定所述第一用户待推送的第一商品。
4.根据权利要求3所述的预测模型训练方法,其特征在于,所述预设模型的网络结构包括输入层、嵌入向量层、注意力层、多门控混合专家网络层、特征交叉层、任务塔层以及输出层,所述输入层连接所述嵌入向量层,所述嵌入向量层连接所述注意力层、所述多门控混合专家网络层以及特征交叉层,所述注意力层连接所述多门控混合专家网络层,所述多门控混合专家网络层以及特征交叉层连接所述任务塔层,所述任务塔层连接所述输出层。
5.根据权利要求3所述的预测模型训练方法,其特征在于,所述根据各个所述训练样本对预设模型进行训练得到预测模型,包括:
获取所述预设模型对所述训练样本的第二预估交互概率以及第二预估交互次数;
根据所述训练样本的输入特征、所述训练样本的标签值、所述第二预估交互概率、所述第二预估交互次数、所述第二预估交互概率对应的权重以及所述第二预估交互次数对应的权重,更新所述预设模型的目标损失函数;
响应于更新后的目标损失函数满足预设条件,停止对所述预设模型进行训练,以得到预测模型。
6.根据权利要求3所述的预测模型训练方法,其特征在于,所述根据各个所述训练样本对预设模型进行训练得到预测模型,包括:
根据各个所述训练样本得到训练数据集、验证数据集以及测试数据集;
根据所述训练数据集中的各个训练样本对所述预设模型进行训练,得到待调整模型;
根据所述验证数据集中的各个训练样本对所述待调整模型进行训练,得到待确定模型,所述验证数据集中的各个训练样本用于对所述待调整模型的网络参数进行调整;
根据所述测试集数据中的各个训练样本对所述待确定模型进行训练,得到所述待确定模型的性能参数;
响应于所述性能参数满足设定条件,将所述待确定模型确定为所述预测模型。
7.一种商品推荐装置,其特征在于,包括:
第一获取模块,用于获取第一用户的基础信息、待推荐的各个第一商品的商品信息、所述第一用户与第二商品的历史交互信息;
输入模块,用于将所述基础信息、所述历史交互信息以及各个所述第一商品的商品信息输入至预测模型,得到所述第一用户对各个所述第一商品的预估交互概率以及预估交互次数;
确定模块,用于根据所述预估交互概率以及所述预估交互次数确定所述第一商品的推荐值;
推送模块,用于将满足预设条件的所述推荐值对应的第一商品,推送至目标终端,所述目标终端是与所述第一用户关联的终端。
8.一种预测模型训练装置,其特征在于,包括:
第二获取模块,用于获取各个训练样本,所述训练样本包括第三商品的商品信息、第二用户的基础信息、所述第二用户与第四商品的历史交互信息;
训练模块,用于根据各个所述训练样本对预设模型进行训练得到预测模型,所述预测模型用于预测第一用户对各个第一商品的预估交互概率以及预估交互次数,所述预估交互概率以及所述预估交互概率用于确定所述第一用户待推送的第二商品。
9.一种介质,其特征在于,包括:计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至2中任一项所述的商品推荐方法或3至6中任一项所述的预测模型训练方法。
10.一种计算设备,其特征在于,包括:
存储器以及处理器;
所述存储器存储计算机执行指令;
所述处理器执行所述存储器存储的计算机执行指令,使得所述处理器执行如权利要求1至2中任一项所述的商品推荐方法或3至6中任一项所述的预测模型训练方法。
CN202211172249.1A 2022-09-26 2022-09-26 商品推荐方法、预测模型训练方法和相关设备 Pending CN115564517A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211172249.1A CN115564517A (zh) 2022-09-26 2022-09-26 商品推荐方法、预测模型训练方法和相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211172249.1A CN115564517A (zh) 2022-09-26 2022-09-26 商品推荐方法、预测模型训练方法和相关设备

Publications (1)

Publication Number Publication Date
CN115564517A true CN115564517A (zh) 2023-01-03

Family

ID=84742657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211172249.1A Pending CN115564517A (zh) 2022-09-26 2022-09-26 商品推荐方法、预测模型训练方法和相关设备

Country Status (1)

Country Link
CN (1) CN115564517A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115841345A (zh) * 2023-02-16 2023-03-24 杭州柚果供应链管理有限公司 跨境大数据智能化分析方法、系统以及存储介质
CN116029357A (zh) * 2023-03-29 2023-04-28 荣耀终端有限公司 训练样本生成、模型训练、点击率评估方法及电子设备
CN117522528A (zh) * 2024-01-04 2024-02-06 厦门智数联科技有限公司 互联网数据检测分析方法和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115841345A (zh) * 2023-02-16 2023-03-24 杭州柚果供应链管理有限公司 跨境大数据智能化分析方法、系统以及存储介质
CN116029357A (zh) * 2023-03-29 2023-04-28 荣耀终端有限公司 训练样本生成、模型训练、点击率评估方法及电子设备
CN116029357B (zh) * 2023-03-29 2023-08-15 荣耀终端有限公司 训练样本生成、模型训练、点击率评估方法及电子设备
CN117522528A (zh) * 2024-01-04 2024-02-06 厦门智数联科技有限公司 互联网数据检测分析方法和系统
CN117522528B (zh) * 2024-01-04 2024-03-12 厦门智数联科技有限公司 互联网数据检测分析方法和系统

Similar Documents

Publication Publication Date Title
US11551239B2 (en) Characterizing and modifying user experience of computing environments based on behavior logs
CN113626719B (zh) 信息推荐方法、装置、设备、存储介质及计算机程序产品
Ghose et al. Modeling consumer footprints on search engines: An interplay with social media
JP5450051B2 (ja) 行動ターゲティングシステム
US20180068371A1 (en) Learning Vector-Space Representations of Items for Recommendations using Word Embedding Models
CN115564517A (zh) 商品推荐方法、预测模型训练方法和相关设备
US11288709B2 (en) Training and utilizing multi-phase learning models to provide digital content to client devices in a real-time digital bidding environment
US10558987B2 (en) System identification framework
CN103748605A (zh) 转化类型到转化类型的传送
US10482491B2 (en) Targeted marketing for user conversion
CN111754278A (zh) 物品推荐方法、装置、计算机存储介质和电子设备
CN114417174B (zh) 内容推荐方法、装置、设备及计算机存储介质
US11544333B2 (en) Analytics system onboarding of web content
CN115018552A (zh) 产品点击率确定方法
CN115438787A (zh) 行为预测系统的训练方法及装置
CN113836390B (zh) 资源推荐方法、装置、计算机设备及存储介质
US20230316106A1 (en) Method and apparatus for training content recommendation model, device, and storage medium
CN116578400A (zh) 多任务数据处理方法和装置
CN114595323B (zh) 画像构建、推荐、模型训练方法、装置、设备及存储介质
CN113362141A (zh) 一种关联商品的推荐方法、装置、介质及电子设备
CN113159877A (zh) 数据处理方法、装置、系统、计算机可读存储介质
US11842379B2 (en) Method and system for obtaining item-based recommendations
JP7044922B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
JP7043648B1 (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN117807254A (zh) 推荐多媒体数据的方法、装置、计算设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination