CN114331602A - 一种基于迁移学习的模型训练方法、信息推荐方法及装置 - Google Patents

一种基于迁移学习的模型训练方法、信息推荐方法及装置 Download PDF

Info

Publication number
CN114331602A
CN114331602A CN202111574273.3A CN202111574273A CN114331602A CN 114331602 A CN114331602 A CN 114331602A CN 202111574273 A CN202111574273 A CN 202111574273A CN 114331602 A CN114331602 A CN 114331602A
Authority
CN
China
Prior art keywords
user
sample data
source domain
determining
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111574273.3A
Other languages
English (en)
Inventor
张锦
王海涛
董健
王永康
王兴星
张亚鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202111574273.3A priority Critical patent/CN114331602A/zh
Publication of CN114331602A publication Critical patent/CN114331602A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书公开了一种基于迁移学习的模型训练方法、信息推荐方法及装置,在接收到用户终端发送的信息推荐请求时,可根据该信息推荐请求中的用户标识,确定用户在目标域中的历史行为数据,以及在源域中的聚合样本数据。之后,根据该用户在目标域中的历史行为数据、在源域的聚合样本数据以及候选商品的商品信息,确定该用户对应于候选商品的融合样本数据。最后,基于该融合样本数据,通过点击预测模型确定该用户对候选商品的预测点击率,以基于该用户对各候选商品的预测点击率,向该用户进行商品推荐。将用户在源域中的聚合样本数据,与在目标域的样本数据进行融合,扩充了样本数据的丰富度,使模型预测结果更准确,提升了信息推荐的命中率。

Description

一种基于迁移学习的模型训练方法、信息推荐方法及装置
技术领域
本申请涉及机器学习技术领域,尤其涉及一种基于迁移学习的模型训练方法、信息推荐方法及装置。
背景技术
随着信息技术的发展,越来越多的电商平台通过推荐系统向用户推荐商品,以提升用户的决策体验。
目前,在向用户进行商品推荐时,可基于该用户在电商平台中的历史行为特征,以及各候选商品的商品特征,通过点击预测模型预测该用户对各候选商品的点击率,以根据预测的用户对各候选商品的点击率,向该用户推荐商品。
但是,对于电商平台中交互行为较少的用户,由于无法获取丰富的用户历史行为数据,导致模型学习不充分,预测结果不准确,信息推荐的命中率较低。
发明内容
本说明书实施例提供一种基于迁移学习的模型训练方法、信息推荐方法及装置,用于部分解决现有技术中的问题。
本说明书实施例采用下述技术方案:
本说明书提供的一种基于迁移学习的模型训练方法,包括:
获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据,所述样本数据中至少包括用户的历史行为数据以及商品信息;
针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据;
针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注;
分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率;
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数;
其中,所述点击预测模型用于进行信息推荐。
可选地,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,具体包括:
确定该用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据;
根据该样本数据、该用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定该用户的融合样本数据。
可选地,确定该用户在所述源域中的若干关联用户,具体包括:
根据该用户在所述源域中的用户标识,以及预先构建的用户索引,确定该用户在所述源域中的若干关联用户。
可选地,构建用户索引,具体包括:
确定所述源域中各用户的用户特征;
针对所述源域中的每个用户,根据该用户的用户特征以及所述源域中各其他用户的用户特征,确定该用户与各其他用户的相似度;
根据该用户与各其他用户的相似度,确定该用户的关联用户,并根据各用户及其关联用户,构建用户索引。
可选地,所述方法还包括:
根据该用户在所述源域中的聚合样本数据,确定第二训练样本,并根据该用户的各样本数据对应在所述源域的业务执行结果,对所述第二训练样本进行标注;
分别将各第二训练样本输入待训练的点击预测模型中,确定各第二训练样本对应的预测点击率;
确定损失函数,具体包括:
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,确定损失函数。
可选地,所述方法还包括:
确定该用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据,作为第三训练样本,并根据各关联用户的各样本数据对应在所述源域的业务执行结果,对所述第三训练样本进行标注;
分别将各第三训练样本输入待训练的点击预测模型中,确定各第三训练样本对应的预测点击率;
确定损失函数,具体包括:
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,以及各第三训练样本对应的预测点击率与各第三训练样本的标注,确定损失函数。
本说明书提供的一种信息推荐方法,包括:
接收用户终端发送的信息推荐请求;
根据所述信息推荐请求中用户的用户标识,确定所述用户在目标域中的历史行为数据,以及所述用户在源域中的各样本数据;
根据所述用户在所述源域中的各样本数据,确定所述用户在所述源域的聚合样本数据;
针对待推荐的每个候选商品,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据;
将所述用户对应于该候选商品的融合样本数据输入预先训练的点击预测模型中,确定所述用户对该候选商品的预测点击率,并根据所述用户对各候选商品的预测点击率,向所述用户进行商品推荐;
其中,所述点击预测模型采用上述基于迁移学习的模型训练方法训练得到。
可选地,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据,具体包括:
确定所述用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据;
根据所述用户在目标域中的历史行为数据、该候选商品的商品信息、所述用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定所述用户的融合样本数据。
本说明书提供一种基于迁移学习的模型训练装置,包括:
获取模块,配置为获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据,所述样本数据中至少包括用户的历史行为数据以及商品信息;
聚合模块,配置为针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据;
标注模块,配置为针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注;
确定模块,配置为分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率;
调参模块,配置为根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数,其中,所述点击预测模型用于进行信息推荐。
本说明书提供一种信息推荐装置,包括:
接收模块,配置为接收用户终端发送的信息推荐请求;
第一确定模块,配置为根据所述信息推荐请求中用户的用户标识,确定所述用户在目标域中的历史行为数据,以及所述用户在源域中的各样本数据;
第二确定模块,配置为根据所述用户在所述源域中的各样本数据,确定所述用户在所述源域的聚合样本数据;
第三确定模块,配置为针对待推荐的每个候选商品,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据;
推荐模块,配置为将所述用户对应于该候选商品的融合样本数据输入预先训练的点击预测模型中,确定所述用户对该候选商品的预测点击率,并根据所述用户对各候选商品的预测点击率,向所述用户进行商品推荐,其中,所述点击预测模型采用上述基于迁移学习的模型训练方法训练得到。
本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于迁移学习的模型训练方法或信息推荐方法。
本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于迁移学习的模型训练方法或信息推荐方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书中,当接收到用户终端发送的信息推荐请求时,可根据该信息推荐请求中用户的用户标识,确定该用户在目标域中的历史行为数据,以及该用户在源域中的聚合样本数据。之后,根据该用户在目标域中的历史行为数据、候选商品的商品信息以及该用户在源域的聚合样本数据,确定该用户对应于候选商品的融合样本数据。最后,将该用户对应于候选商品的融合样本数据输入点击预测模型中,确定该用户对候选商品的预测点击率,以基于该用户对各候选商品的预测点击率,向该用户进行商品推荐。将用户在源域中的聚合样本数据,与用户在目标域的样本数据进行融合,扩充了用户在目标域中样本数据的丰富度,使模型预测结果更准确,提升了信息推荐的命中率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本说明书实施例提供的一种基于迁移学习的模型训练方法的流程示意图;
图2为本说明书实施例提供的一种样本融合的示意图;
图3为本说明书实施例提供的一种样本融合的示意图;
图4为本说明书实施例提供的一种多任务模型训练的示意图;
图5为本说明书实施例提供的一种信息推荐方法的流程示意图;
图6为本说明书实施例提供的一种基于迁移学习的模型训练装置的结构示意图;
图7为本说明书实施例提供的一种信息推荐装置的结构示意图;
图8为本说明书实施例提供的实现基于迁移学习的模型训练方法或信息推荐方法的电子设备示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,在通过推荐系统向用户进行信息推荐时,以商品推荐为例,为了提高信息推荐的命中率,可预先采用点击预测模型预测用户对各候选商品的点击率,以从中选取用户点击概率较高的商品进行推荐。
而对于平台中交互行为较少的用户或冷启动的应用,由于无法收集到丰富的用户行为数据,对于用户的兴趣学习不充分,导致点击率预测结果的准确率较差。
基于上述存在的技术问题,本说明书提供一种基于迁移学习的模型训练方法,可由进行模型训练的服务器执行,以下结合附图,详细说明本申请各实施例提供的技术方案。
图1为本说明书实施例提供的一种基于迁移学习的模型训练方法的流程示意图,具体可包括以下步骤:
S100:获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据。
一般的,在训练针对某种业务场景的点击预测模型时,可基于该业务场景下的用户行为数据,作为训练样本进行模型训练。但当该业务场景下的用户行为数据不足时,无法充分学习到用户的兴趣特征,导致模型的训练效果不佳。
而同一用户在相近的业务场景下,用户的兴趣也是相近的,因此为了收集到丰富的用户行为数据,使模型学习更充分,本说明书提供了一种模型训练方法,可采用迁移学习的方式,将用户在其它相似场景中丰富的用户行为数据,应用于只有少量用户行为数据的业务场景中,以使模型充分学习用户兴趣。如,将用户在外卖平台中的行为数据应用于买菜平台中,以充分学习用户的兴趣特征。
在本说明书中,将待提升性能的业务场景称为目标域,训练的点击预测模型用于对用户在目标域中的点击行为进行预测,而将提供辅助信息的业务场景称为源域。在模型训练过程中,可基于目标域中的样本数据和源域中的样本数据,确定训练样本。
具体的,可先获取若干用户在目标域中的各样本数据,并针对每个用户,获取该用户在源域中的各样本数据。其中,该用户为在源域和目标域两个业务场景中存在重叠的用户,样本数据基于用户已执行的历史行为数据确定。
并且,在对点击预测模型进行训练时,可基于用户历史上浏览各商品时,对各商品的点击情况和未点击情况,作为正负样本进行训练。于是本说明书获取的样本数据中,至少包括用户浏览的商品的商品信息,如品类、价格等,以及用户浏览之前的历史行为数据,如用户历史购买、浏览、点击的商品等,表征用户的历史行为特征。此外,该样本数据中还可包含用户的用户信息,如年龄、职业等。
S102:针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据。
S104:针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注。
在获取到源域和目标域中的样本数据后,由于目标域中只有少量的样本数据,学习到的用户兴趣特征不充分,而用户在源域中有充足的样本数据,能够学到良好的兴趣特征,于是,可将用户在源域中的兴趣特征融合到目标域的兴趣特征中,使用户兴趣表征更准确。
具体的,针对每个用户,可根据该用户在源域中的各样本数据,进行样本聚合,确定该用户在源域中的聚合样本数据,以表征该用户在源域中的兴趣。之后,针对该用户在目标域中的每个样本数据,将该样本数据与该用户在源域中的聚合样本数据进行拼接,确定该用户的融合样本数据。并将该用户的融合样本数据作为第一训练样本。其中,该融合样本数据中融合有用户在源域与目标域两个业务场景下的行为特征,表征用户在两个业务场景下的兴趣偏好。
最后,根据该样本数据对应在目标域的业务执行结果,对该第一训练样本进行标注。其中,该样本数据中至少包括用户所浏览的商品的商品信息,样本数据对应在目标域的业务执行结果指的是用户对在目标域中所浏览的商品是否进行了点击。若在该样本数据中用户对所浏览的商品进行了点击,则可将该样本数据对应的第一训练样本标注为1,否则可标注为0。
进一步的,在进行样本聚合时,可将该用户在源域中的各样本数据,输入长短期记忆网络(Long Short Term Memory networks,LSTM)中进行聚合,得到该用户在源域中的聚合样本数据。或者在另一种实施例中,也可将各样本数据的平均值,作为聚合样本数据。
S106:分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率。
S108:根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数。
在将源域与目标域的用户兴趣进行拼接后,得到了表征更准确的融合样本数据,可基于各融合样本数据,训练点击预测模型。
具体的,针对每个第一训练样本,将该第一训练样本输入待训练的点击预测模型中,确定该第一训练样本对应的预测点击率。之后,根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化该损失函数为目标,调整该点击预测模型中的模型参数。
图2为本说明书实施例提供的一种样本融合的示意图。采用迁移学习的方式训练模型时,针对目标域中的每个样本数据,可从源域中获取对应用户的若干样本数据,并对该用户的各样本数据进行聚合,得到该用户在源域中的聚合样本数据。之后,针对该用户在目标域中的每条样本数据,将该样本数据与该用户在源域中的聚合样本数据进行拼接,得到融合样本数据。并将该融合样本数据作为第一训练样本,训练点击预测模型。
如图1所示的基于迁移学习的模型训练方法,将用户在源域中的聚合样本数据,与用户在目标域的样本数据进行融合,扩充了用户在目标域中样本数据的丰富度,使得模型训练效果更好,对用户兴趣的学习更充分,模型预测更准确。
在本说明书一种实施例中,当用户在源域和目标域中的行为数据均不充足时,即使将两个业务场景中的样本数据进行融合,也无法充分学习到用户的兴趣。因此基于源域中兴趣相似的用户在目标域中兴趣也会相似的假定前提,可将源域中与该用户兴趣相似的关联用户的样本数据,也应用于目标域中。
于是,在步骤S104中确定该用户的融合样本数据时,可确定该用户在源域中的若干关联用户,并可将各关联用户在源域中的各样本数据输入LSTM网络中进行样本聚合,得到各关联用户在源域中的聚合样本数据。以根据该样本数据、该用户在源域中的聚合样本数据以及各关联用户在源域中的聚合样本数据,进行拼接得到该用户的融合样本数据。
图3为本说明书实施例提供的一种样本融合的示意图。在确定模型训练的训练样本时,可针对目标域中的每个样本数据,可从源域中获取对应用户的若干样本数据,并对该用户的各样本数据进行聚合,得到该用户在源域中的聚合样本数据。并基于用户索引确定该用户在源域中的若干关联用户,并对各关联用户在源域中的样本数据进行聚合,得到各关联用户在源域中的聚合样本数据。之后,针对该用户在目标域中的每条样本数据,将该样本数据、该用户在源域中的聚合样本数据以及各关联用户在源域中的聚合样本数据进行拼接,得到融合样本数据。并将该融合样本数据作为第一训练样本,训练点击预测模型。
进一步的,在确定该用户在源域中的若干关联用户时,可根据该用户在源域中的用户标识,以及预先构建的用户索引,确定该用户在源域中的若干关联用户。
在构建用户索引时,可先确定源域中各用户的用户特征。之后,针对源域中的每个用户,根据该用户的用户特征以及源域中各其他用户的用户特征,确定该用户与各其他用户的相似度。其中,用户之间的相似度可采用用户特征的余弦相似度或皮尔逊相关系数等指标表示。最后,按照该用户与各其他用户的相似度的排序,确定排序前N个的其他用户作为该用户的关联用户。并根据源域中各用户及其关联用户,构建源域的用户索引,用于查找与用户相似度较高的关联用户。其中,N可根据需要设置。
更进一步的,在确定用户的用户特征时,可根据用户在源域中的用户信息、源域中各商家的商家信息以及用户与商家之间的关联关系,以用户和商家为节点,以用户与商家之间的关联关系为边,构建图网络。其中,用户与商家之间的关联关系包括但不限于用户购买过、浏览过或点击过商家的商品。之后,将图网络输入图卷积神经网络中,确定该图网络中各节点的节点特征,并将用户节点的节点特征作为该用户的用户特征。
或者,在另一种实施方式中,还可根据源域中用户与商品的交互行为数据,确定用户-商品的交互特征user-item,并对user-item进行矩阵分解,得到用户特征与商品特征。
在本说明书一种实施例中,由于目标域中只有少量的样本数据,即使将用户在源域中的聚合样本数据拼接到目标域的样本数据中,也只是扩展了目标域中样本数据的丰富度,尽管一定程度上提升了模型的训练效果,但目标域中的样本数量并未得到提升。也就是说,由于样本数量不足导致的模型学习效果欠佳的问题仍然存在。
由于源域中有丰富的样本数据,并且用户在源域和目标域中的兴趣相近,为了提升模型的训练效果,针对目标域中的每个用户,可将该用户在源域中的聚合样本数据,作为第二训练样本,并根据该用户的各样本数据对应在源域的业务执行结果,对该第二训练样本进行标注。之后,分别将各第二训练样本输入待训练的点击预测模型中,确定各第二训练样本对应的预测点击率。最后,根据各第一训练样本对应的预测点击率与各第一训练样本的标注之间的差异,各第二训练样本对应的预测点击率与各第二训练样本的标注之间的差异,确定损失函数,并以最小化损失函数为目标,调整模型参数。
其中,在对该第二训练样本进行标注时,可根据该用户的各样本数据对应在源域的业务执行结果,先对各样本数据进行标注,如在样本数据中用户对所浏览的商品进行了点击,则可将该样本数据标注为1,否则标注为0。之后,将该用户的各样本数据的标注的平均值,作为该第二训练样本的标注。
在本说明书另一种实施例中,针对目标域中的每个用户,可确定该用户在源域中的若干关联用户,并根据各关联用户在源域中的各样本数据,进行样本聚合,确定各关联用户在源域中的聚合样本数据,作为第三训练样本。之后,根据各关联用户的各样本数据对应在源域的业务执行结果,对第三训练样本进行标注。然后,分别将各第三训练样本输入待训练的点击预测模型中,确定各第三训练样本对应的预测点击率。最后,根据各第一训练样本对应的预测点击率与各第一训练样本的标注之间的差异,各第二训练样本对应的预测点击率与各第二训练样本的标注之间的差异,以及各第三训练样本对应的预测点击率与各第三训练样本的标注之间的差异,确定损失函数,并以最小化损失函数为目标,调整模型参数。
其中,在对第三训练样本进行标注时,可根据各关联用户的各样本数据对应在源域的业务执行结果,先对各样本数据进行标注,如在样本数据中关联用户对所浏览的商品进行了点击,则可将该样本数据标注为1,否则标注为0。之后,将各关联用户的各样本数据的标注的平均值,作为该第三训练样本的标注。
图4为本说明书实施例提供的一种多任务模型训练的示意图,在进行模型训练时,针对目标域中的每个样本数据,可从源域中获取对应用户的聚合样本数据,以及该用户在源域中的关联用户的聚合样本数据。之后,将该样本数据、该用户在源域中的聚合样本数据以及该用户的各关联用户在源域中的聚合样本数据,进行拼接得到融合样本数据。最后,将融合样本数据作为第一训练样本,将各用户的聚合样本数据作为第二训练样本,将各用户的关联用户的聚合样本数据作为第三训练样本,分别输入点击预测模型中得到各训练样本对应的预测点击率,进行多任务联合训练。
其中,用户在源域中的聚合样本数据基于该用户在源域中的各样本数据聚合得到,该用户的各关联用户在源域中的聚合样本数据基于各关联用户的各样本数据聚合得到的。该点击预测模型可采用常见的多任务学习模型,如多任务混合专家模型(Multi-gateMixture-of-Experts,MMOE)、渐进式分层提取模型(Progressive Layered Extraction,PLE)等。
基于图1所示的模型训练方法,本说明书还对应提供了模型训练完成后的应用方法。在通过图1所示的方法训练得到点击预测模型后,可应用于信息推荐的业务场景中。以下结合附图,详细说明本申请各实施例提供的技术方案。
图5为本说明书实施例提供的一种信息推荐方法的流程示意图,具体可包括以下步骤:
S200:接收用户终端发送的信息推荐请求。
S202:根据所述信息推荐请求中用户的用户标识,确定所述用户在目标域中的历史行为数据,以及所述用户在源域中的各样本数据。
本说明书提供的信息推荐方法,可由推荐系统的服务器执行。在冷启动或用户数据不足的目标域中,在向用户推荐商品时,可采用上述训练完成的点击预测模型,预测用户对各候选商品的点击率,从而向用户推荐点击概率较大的商品,提高推荐命中率。
具体的,该服务器可接收用户终端发送的信息推荐请求。其中,该信息推荐请求可以是用户的搜索请求,也可以是首页加载请求等。之后,该服务器可根据该信息推荐请求中携带的用户标识,确定该用户在目标域中的历史行为数据,即表征该用户在目标域的历史行为特征。
并且,由于用户在目标域中的行为数据不足,因此为了更充分学习到用户的兴趣,可根据该用户标识,确定对应用户在源域中的各样本数据。其中,样本数据中至少包括用户在源域中所浏览或点击过的商品及商品信息。
进一步的,由于用户兴趣随时间产生变化,为了更准确的预测用户对候选商品的点击率,可获取用户最新在源域中的各样本数据,如最近一个月内的样本数据。
S204:根据所述用户在所述源域中的各样本数据,确定所述用户在所述源域的聚合样本数据。
S206:针对待推荐的每个候选商品,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据。
S208:将所述用户对应于该候选商品的融合样本数据输入预先训练的点击预测模型中,确定所述用户对该候选商品的预测点击率,并根据所述用户对各候选商品的预测点击率,向所述用户进行商品推荐。
由于目标域中用户的行为特征不足,因此在获取到用户在源域中的行为数据后,可将该用户在源域中的行为特征,融合到目标域中。
具体的,该服务器可根据该用户在源域中的各样本数据,进行样本聚合,确定该用户在源域的聚合样本数据,即表征该用户在源域中的行为特征。之后,针对待推荐的每个候选商品,根据该用户在目标域中的历史行为数据、该候选商品的商品信息,以及该用户在源域的聚合样本数据,进行特征拼接,得到该用户对应于该候选商品的融合样本数据。最后,将该用户对应于该候选商品的融合样本数据,输入预先训练的点击预测模型中,得到该用户对该候选商品的预测点击率,以根据该用户对各候选商品的预测点击率的排序,从中筛选预测点击率较高的候选商品向用户推荐,从而提高信息推荐的命中率。
其中,本说明书中所采用的点击预测模型可采用上述迁移学习方法进行训练,具体训练过程详见上述内容,本说明书在此不再赘述。
进一步的,在确定该用户对应于该候选商品的融合样本数据时,为了进一步提高样本数据的丰富度,还可确定该用户在源域中的若干关联用户,并确定各关联用户在源域中的各样本数据。之后,基于各关联用户在源域中的各样本数据,进行样本聚合,确定各关联用户在源域中的聚合样本数据。最后,根据该用户在目标域中的历史行为数据、该候选商品的商品信息、该用户在源域中的聚合样本数据,以及该用户的各关联用户在源域中的聚合样本数据,确定该用户的融合样本数据。
其中,用户在源域中的关联用户可基于用户索引进行查找,用户索引的构建在上述已经进行了详细说明,可参见上述内容。
基于图5所示的信息推荐方法,当接收到用户终端发送的信息推荐请求时,可根据该信息推荐请求中用户的用户标识,确定该用户在目标域中的历史行为数据,以及该用户在源域中的聚合样本数据。之后,根据该用户在目标域中的历史行为数据、候选商品的商品信息以及该用户在源域的聚合样本数据,确定该用户对应于候选商品的融合样本数据。最后,将该用户对应于候选商品的融合样本数据输入点击预测模型中,确定该用户对候选商品的预测点击率,以基于该用户对各候选商品的预测点击率,向该用户进行商品推荐。将用户在源域中的聚合样本数据,与用户在目标域的样本数据进行融合,扩充了用户在目标域中样本数据的丰富度,使模型预测结果更准确,提升了信息推荐的命中率。
基于图1所示的一种基于迁移学习的模型训练方法,本说明书实施例还对应提供一种基于迁移学习的模型训练装置的结构示意图,如图6所示。
图6为本说明书实施例提供的一种基于迁移学习的模型训练装置的结构示意图,包括:
获取模块300,配置为获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据,所述样本数据中至少包括用户的历史行为数据以及商品信息;
聚合模块302,配置为针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据;
标注模块304,配置为针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注;
确定模块306,配置为分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率;
调参模块308,配置为根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数,其中,所述点击预测模型用于进行信息推荐。
可选地,所述标注模块304具体用于,确定该用户在所述源域中的若干关联用户,根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据,根据该样本数据、该用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定该用户的融合样本数据。
可选地,所述标注模块304具体用于,根据该用户在所述源域中的用户标识,以及预先构建的用户索引,确定该用户在所述源域中的若干关联用户。
可选地,所述标注模块304具体用于,确定所述源域中各用户的用户特征,针对所述源域中的每个用户,根据该用户的用户特征以及所述源域中各其他用户的用户特征,确定该用户与各其他用户的相似度,根据该用户与各其他用户的相似度,确定该用户的关联用户,并根据各用户及其关联用户,构建用户索引。
可选地,所述确定模块306还用于,根据该用户在所述源域中的聚合样本数据,确定第二训练样本,并根据该用户的各样本数据对应在所述源域的业务执行结果,对所述第二训练样本进行标注,分别将各第二训练样本输入待训练的点击预测模型中,确定各第二训练样本对应的预测点击率,所述调参模块308还用于,根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,确定损失函数。
可选地,所述确定模块306还用于,确定该用户在所述源域中的若干关联用户,根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据,作为第三训练样本,并根据各关联用户的各样本数据对应在所述源域的业务执行结果,对所述第三训练样本进行标注,分别将各第三训练样本输入待训练的点击预测模型中,确定各第三训练样本对应的预测点击率,所述调参模块308还用于,根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,以及各第三训练样本对应的预测点击率与各第三训练样本的标注,确定损失函数。
基于图5所示的一种信息推荐方法,本说明书实施例还对应提供一种信息推荐装置的结构示意图,如图7所示。
图7为本说明书实施例提供的一种信息推荐装置的结构示意图,包括:
接收模块400,配置为接收用户终端发送的信息推荐请求;
第一确定模块402,配置为根据所述信息推荐请求中用户的用户标识,确定所述用户在目标域中的历史行为数据,以及所述用户在源域中的各样本数据;
第二确定模块404,配置为根据所述用户在所述源域中的各样本数据,确定所述用户在所述源域的聚合样本数据;
第三确定模块406,配置为针对待推荐的每个候选商品,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据;
推荐模块408,配置为将所述用户对应于该候选商品的融合样本数据输入预先训练的点击预测模型中,确定所述用户对该候选商品的预测点击率,并根据所述用户对各候选商品的预测点击率,向所述用户进行商品推荐,其中,所述点击预测模型采用上述基于迁移学习的模型训练方法训练得到。
可选地,所述第三确定模块406具体用于,确定所述用户在所述源域中的若干关联用户,根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息、所述用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定所述用户的融合样本数据。
本说明书实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的基于迁移学习的模型训练方法或图5提供的信息推荐方法。
根据图1所示的基于迁移学习的模型训练方法或图5所示的信息推荐方法,本说明书实施例还提出了图8所示的电子设备的示意结构图。如图8,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所示的基于迁移学习的模型训练方法或图5所示的信息推荐方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和生成专用的集成电路芯片。而且,如今,取代手工地生成集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

Claims (12)

1.一种基于迁移学习的模型训练方法,其特征在于,包括:
获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据,所述样本数据中至少包括用户的历史行为数据以及商品信息;
针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据;
针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注;
分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率;
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数;
其中,所述点击预测模型用于进行信息推荐。
2.如权利要求1所述的方法,其特征在于,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,具体包括:
确定该用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据;
根据该样本数据、该用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定该用户的融合样本数据。
3.如权利要求2所述的方法,其特征在于,确定该用户在所述源域中的若干关联用户,具体包括:
根据该用户在所述源域中的用户标识,以及预先构建的用户索引,确定该用户在所述源域中的若干关联用户。
4.如权利要求3所述的方法,其特征在于,构建用户索引,具体包括:
确定所述源域中各用户的用户特征;
针对所述源域中的每个用户,根据该用户的用户特征以及所述源域中各其他用户的用户特征,确定该用户与各其他用户的相似度;
根据该用户与各其他用户的相似度,确定该用户的关联用户,并根据各用户及其关联用户,构建用户索引。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据该用户在所述源域中的聚合样本数据,确定第二训练样本,并根据该用户的各样本数据对应在所述源域的业务执行结果,对所述第二训练样本进行标注;
分别将各第二训练样本输入待训练的点击预测模型中,确定各第二训练样本对应的预测点击率;
确定损失函数,具体包括:
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,确定损失函数。
6.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定该用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据,作为第三训练样本,并根据各关联用户的各样本数据对应在所述源域的业务执行结果,对所述第三训练样本进行标注;
分别将各第三训练样本输入待训练的点击预测模型中,确定各第三训练样本对应的预测点击率;
确定损失函数,具体包括:
根据各第一训练样本对应的预测点击率与各第一训练样本的标注,各第二训练样本对应的预测点击率与各第二训练样本的标注,以及各第三训练样本对应的预测点击率与各第三训练样本的标注,确定损失函数。
7.一种信息推荐方法,其特征在于,包括:
接收用户终端发送的信息推荐请求;
根据所述信息推荐请求中用户的用户标识,确定所述用户在目标域中的历史行为数据,以及所述用户在源域中的各样本数据;
根据所述用户在所述源域中的各样本数据,确定所述用户在所述源域的聚合样本数据;
针对待推荐的每个候选商品,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据;
将所述用户对应于该候选商品的融合样本数据输入预先训练的点击预测模型中,确定所述用户对该候选商品的预测点击率,并根据所述用户对各候选商品的预测点击率,向所述用户进行商品推荐;
其中,所述点击预测模型采用权利要求1~6任一所述的方法训练得到。
8.如权利要求7所述的方法,其特征在于,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据,具体包括:
确定所述用户在所述源域中的若干关联用户;
根据各关联用户在所述源域中的各样本数据,确定各关联用户在所述源域中的聚合样本数据;
根据所述用户在目标域中的历史行为数据、该候选商品的商品信息、所述用户在所述源域中的聚合样本数据,以及各关联用户在所述源域中的聚合样本数据,确定所述用户的融合样本数据。
9.一种基于迁移学习的模型训练装置,其特征在于,包括:
获取模块,配置为获取若干用户在目标域中的各样本数据,以及所述各用户在源域中的各样本数据,所述样本数据中至少包括用户的历史行为数据以及商品信息;
聚合模块,配置为针对所述每个用户,根据该用户在所述源域中的各样本数据,确定该用户在所述源域中的聚合样本数据;
标注模块,配置为针对该用户在所述目标域中的每个样本数据,根据该样本数据以及该用户在所述源域中的聚合样本数据,确定该用户的融合样本数据,作为第一训练样本,并根据该样本数据对应在所述目标域的业务执行结果,对所述第一训练样本进行标注;
确定模块,配置为分别将各第一训练样本输入待训练的点击预测模型中,确定各第一训练样本对应的预测点击率;
调参模块,配置为根据各第一训练样本对应的预测点击率与各第一训练样本的标注,确定损失函数,并以最小化所述损失函数为目标,调整所述点击预测模型中的模型参数,其中,所述点击预测模型用于进行信息推荐。
10.一种信息推荐装置,其特征在于,包括:
接收模块,配置为接收用户终端发送的信息推荐请求;
第一确定模块,配置为根据所述信息推荐请求中用户的用户标识,确定所述用户在目标域中的历史行为数据,以及所述用户在源域中的各样本数据;
第二确定模块,配置为根据所述用户在所述源域中的各样本数据,确定所述用户在所述源域的聚合样本数据;
第三确定模块,配置为针对待推荐的每个候选商品,根据所述用户在目标域中的历史行为数据、该候选商品的商品信息,以及所述用户在所述源域的聚合样本数据,确定所述用户对应于该候选商品的融合样本数据;
推荐模块,配置为将所述用户对应于该候选商品的融合样本数据输入预先训练的点击预测模型中,确定所述用户对该候选商品的预测点击率,并根据所述用户对各候选商品的预测点击率,向所述用户进行商品推荐,其中,所述点击预测模型采用权利要求1~6任一所述的方法训练得到。
11.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~6或权利要求7~8任一所述的方法。
12.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~6或权利要求7~8任一所述的方法。
CN202111574273.3A 2021-12-21 2021-12-21 一种基于迁移学习的模型训练方法、信息推荐方法及装置 Pending CN114331602A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111574273.3A CN114331602A (zh) 2021-12-21 2021-12-21 一种基于迁移学习的模型训练方法、信息推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111574273.3A CN114331602A (zh) 2021-12-21 2021-12-21 一种基于迁移学习的模型训练方法、信息推荐方法及装置

Publications (1)

Publication Number Publication Date
CN114331602A true CN114331602A (zh) 2022-04-12

Family

ID=81054923

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111574273.3A Pending CN114331602A (zh) 2021-12-21 2021-12-21 一种基于迁移学习的模型训练方法、信息推荐方法及装置

Country Status (1)

Country Link
CN (1) CN114331602A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114841783A (zh) * 2022-05-27 2022-08-02 阿里巴巴(中国)有限公司 商品信息处理方法、装置、终端设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114841783A (zh) * 2022-05-27 2022-08-02 阿里巴巴(中国)有限公司 商品信息处理方法、装置、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CN110674408B (zh) 业务平台、训练样本的实时生成方法及装置
CN113688313A (zh) 一种预测模型的训练方法、信息推送的方法及装置
CN107506367B (zh) 确定应用展示内容的方法、装置及服务器
CN114202370A (zh) 一种信息推荐方法和装置
CN110717536A (zh) 一种生成训练样本的方法及装置
CN112966186A (zh) 一种模型训练和信息推荐的方法及装置
CN113641896A (zh) 一种模型训练以及推荐概率预测方法及装置
CN112733024A (zh) 一种信息推荐的方法及装置
CN110599307A (zh) 一种商品推荐的方法及装置
CN115238826B (zh) 一种模型训练的方法、装置、存储介质及电子设备
CN115048577A (zh) 一种模型训练方法、装置、设备及存储介质
CN111191132A (zh) 一种信息推荐方法、装置及电子设备
CN113641894A (zh) 一种信息推荐的方法及装置
CN112966577B (zh) 一种模型训练以及信息提供的方法及装置
CN111144974A (zh) 一种信息展示方法及装置
CN114331602A (zh) 一种基于迁移学习的模型训练方法、信息推荐方法及装置
CN113343095A (zh) 一种模型训练以及信息推荐方法及装置
CN112699307A (zh) 一种信息的生成方法及装置
CN113408254A (zh) 一种页面表单信息填写方法、装置、设备和可读介质
CN113010809A (zh) 一种信息推荐的方法及装置
CN113343085B (zh) 一种信息推荐方法、装置、存储介质及电子设备
CN114996570A (zh) 一种信息推荐的方法及装置
CN115660105A (zh) 一种模型训练的方法、业务风控的方法及装置
CN114861043A (zh) 一种模型训练以及推荐位置确定方法及装置
CN114116816A (zh) 一种推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication