CN115409579A - 一种基于元学习的响应式推荐方法、系统及设备 - Google Patents

一种基于元学习的响应式推荐方法、系统及设备 Download PDF

Info

Publication number
CN115409579A
CN115409579A CN202211072658.4A CN202211072658A CN115409579A CN 115409579 A CN115409579 A CN 115409579A CN 202211072658 A CN202211072658 A CN 202211072658A CN 115409579 A CN115409579 A CN 115409579A
Authority
CN
China
Prior art keywords
user
commodity
embedded representation
learning
meta
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211072658.4A
Other languages
English (en)
Inventor
周明强
李坤朋
代开浪
钱致远
李梦娇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN202211072658.4A priority Critical patent/CN115409579A/zh
Publication of CN115409579A publication Critical patent/CN115409579A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于元学习的响应式推荐方法、系统及设备,方法包括:构建基于元学习的响应式推荐模型,基于元学习的响应式推荐模型包括异构信息网络的元学习器和ID嵌入表示生成器;利用获取的数据,对基于元学习的响应式推荐模型进行训练,得到训练完成的基于元学习的响应式推荐模型以及模型优化参数;获取待推荐用户的用户‑商品历史评分数据,并基于评分数据、训练完成的推荐模型以及模型优化参数,获得目标推荐商品并推荐给用户。本发明采用基于元学习的响应式推荐方法,引入元学习和ID嵌入表示生成器,从而从根源上解决了现有的老用户兴趣变化的响应性问题以及新用户和新商品的初始响应问题,导致推荐准确性低、用户满意度低的问题。

Description

一种基于元学习的响应式推荐方法、系统及设备
技术领域
本发明属于个性化推荐领域,具体涉及一种基于元学习的响应式推荐方法、系统及设备。
背景技术
推荐系统旨在帮助用户寻找其感兴趣的事物,正被应用到越来越多的互联网服务中。推荐任务通常可形式化为评分预测任务,即预测用户对候选商品的评分。一个优秀的推荐系统能够根据老用户少量的最新交互信息及时响应老用户的兴趣变化,也能快速捕捉新用户的兴趣以更好地满足新用户的需求。协同过滤(Collaborative Filtering,CF)通过分析用户和商品的历史交互记录(例如评分数据),挖掘用户和商品的个性化信息(例如用户的偏好、商品的质量等),然后为用户进行精准的个性化推荐服务。但是存在无法及时有效地捕捉到老用户兴趣的变化和新用户以及上架新商品初始响应等问题。
然而,现有的推荐方法存在无法及时有效地捕捉到老用户兴趣的变化和新用户以及上架新商品初始响应等问题,商品推荐准确性不高、用户满意度低的问题。
因此,如何解决老用户兴趣变化的响应性问题以及新用户和新商品的初始响应问题,提高商品推荐方法的准确性,提升用户满意度,是本领域亟待解决的问题。
发明内容
本发明的目的是针对现有技术的缺陷,提供一种基于元学习的响应式推荐方法、系统及设备。本发明基于元学习的响应式推荐方法,引入了基于优化的元学习方法,以及引入的ID嵌入表示生成器通过神经网络将用户和商品的属性信息作为输入为新用户和商品生成较好地初始嵌入表示,从而从根源上解决了现有的老用户兴趣变化的响应性问题以及新用户和新商品的初始响应问题,导致推荐准确性低、用户满意度低的问题。
为了实现以上目的,本发明采用以下技术方案:
一种基于元学习的响应式推荐方法,具体包括如下步骤:
S1、构建基于元学习的响应式推荐模型;所述基于元学习的响应式推荐模型包括异构信息网络的元学习器和ID嵌入表示生成器,所述异构信息网络的元学习器包括用户嵌入表示模块、商品嵌入表示模块、嵌入表示连接层、评分预测器;
所述用户嵌入表示模块,将用户的嵌入表示记为
Figure BDA0003829718250000021
其计算方式为:
Figure BDA0003829718250000022
其中,
Figure BDA0003829718250000023
为用户u的基础嵌入表示,通过用户ID从嵌入矩阵
Figure BDA0003829718250000024
中查找获得;fU(·)是一个映射函数,为多层感知机MLP,它将用户u的multi-hot形式的属性向量
Figure BDA0003829718250000025
映射到与
Figure BDA0003829718250000026
相同的空间,得到用户的属性嵌入表示;所述属性向量包括用户年龄、性别;
Figure BDA0003829718250000027
为可训练的权重矩阵,将语义嵌入表示
Figure BDA0003829718250000028
转换到与
Figure BDA0003829718250000029
相同的空间;α与β分别为
Figure BDA00038297182500000210
Figure BDA00038297182500000211
的系数,决定了它们在
Figure BDA00038297182500000212
中的重要性;
其中,语义嵌入表示
Figure BDA00038297182500000213
的计算可表示为:
Figure BDA00038297182500000214
其中,ωu是hu的权重,子嵌入表示hu可通过聚合其邻居节点的嵌入表示得到:
Figure BDA00038297182500000215
其中,g(·)是一个均值聚合函数,
Figure BDA00038297182500000216
是用户u在异构信息网络G中的采样邻居集合;
所述商品嵌入表示模块,对于商品i,通过与用户相同的网络结构得到商品嵌入表示
Figure BDA00038297182500000217
其计算方式为:
Figure BDA00038297182500000218
其中,
Figure BDA00038297182500000219
为商品i的基础嵌入表示,通过商品ID从嵌入矩阵
Figure BDA00038297182500000220
中查找获得;fI(·)是一个映射函数,为多层感知机MLP,它将商品i的multi-hot形式的属性向量
Figure BDA00038297182500000221
映射到与
Figure BDA00038297182500000222
相同的空间,得到商品的属性嵌入表示;所述属性向量包括商品价格、类别;Wi I为可训练的权重矩阵,将语义嵌入表示
Figure BDA00038297182500000223
转换到与
Figure BDA00038297182500000224
相同的空间;λ与θ分别为
Figure BDA00038297182500000225
Figure BDA00038297182500000226
的系数,决定了它们在
Figure BDA00038297182500000227
中的重要性;
其中,语义嵌入表示
Figure BDA0003829718250000031
的计算可表示为:
Figure BDA0003829718250000032
其中,ωi是hi的权重,子嵌入表示hi可通过聚合其邻居节点的嵌入表示得到:
Figure BDA0003829718250000033
其中,g(·)是一个均值聚合函数,
Figure BDA0003829718250000034
是商品i在异构信息网络GI中的采样邻居集合;
所述嵌入表示连接层,将所述用户嵌入表示模块得到的用户嵌入表示和所述商品嵌入表示模块得到的商品嵌入表示进行拼接,得到最终的嵌入表示;
所述评分预测器,将所述最终的嵌入表示输入至评分预测器,生成用户对商品的评分;具体地,评分预测器使用MLP来建模用户和商品嵌入表示之间的关系,将用户u对商品i的预测评分
Figure BDA0003829718250000035
计算为:
Figure BDA0003829718250000036
其中,M(·)表示多层感知机,
Figure BDA0003829718250000037
表示向量拼接操作;
所述ID嵌入表示生成器,它通过神经网络将新用户u或新商品i的属性
Figure BDA0003829718250000038
Figure BDA0003829718250000039
作为输入信息,输出ID嵌入表示,该过程可形式化为:
Figure BDA00038297182500000310
Figure BDA00038297182500000311
Figure BDA00038297182500000312
Figure BDA00038297182500000313
其中,
Figure BDA00038297182500000314
Figure BDA00038297182500000315
分别为用户和商品的初始嵌入表示,
Figure BDA00038297182500000316
Figure BDA00038297182500000317
分别为用户和商品的子嵌入表示,
Figure BDA00038297182500000318
gU(·)和gI(·)分别为对应的ID嵌入表示生成器,是一个多层感知机;
S2、利用获取的数据,对所述基于元学习的响应式推荐模型进行训练,得到训练完成的基于元学习的响应式推荐模型以及模型优化参数κ123
S21、获取所有用户的用户-商品历史评分数据R={(u,i,ru,i)},将R按用户划分为多个子集R1,R2,...,Rm,并对模型参数进行初始化;
S22、在每个训练周期,以用户为单位划分多个批次Batches={B1,B2,...}进行训练,将用户集Ru随机划分为支持集
Figure BDA0003829718250000041
和查询集
Figure BDA0003829718250000042
且保证
Figure BDA0003829718250000043
其中Ru表示用户u的用户-商品历史评分数据;
S23、构建任务
Figure BDA0003829718250000044
其中
Figure BDA0003829718250000045
Figure BDA0003829718250000046
Figure BDA0003829718250000047
Figure BDA0003829718250000048
分别对应元学习中的支持集和查询集,
Figure BDA0003829718250000049
Figure BDA00038297182500000410
分别表示用户u和商品i的相关信息,具体表示为:
Figure BDA00038297182500000411
Figure BDA00038297182500000412
其中,u和i分别表示用户和商品的ID,
Figure BDA00038297182500000413
Figure BDA00038297182500000414
分别表示用户u和商品i的属性向量,
Figure BDA00038297182500000415
Figure BDA00038297182500000416
分别为用户u在多层网络GU,商品i在多层网络GI中的采样邻居集合:
Figure BDA00038297182500000417
Figure BDA00038297182500000418
S24、根据对应元学习中的支持集
Figure BDA00038297182500000419
对所述基于元学习的响应式推荐模型进行内循环元学习训练,对所述评分预测器的参数进行局部更新;
局部更新,具体步骤为:通过全局先验参数κ2对特定于任务Tu的参数进行初始化,然后在
Figure BDA00038297182500000420
上计算损失
Figure BDA00038297182500000421
Figure BDA00038297182500000422
最后,更新κ得到特定于任务Tu的参数κ2,u
Figure BDA00038297182500000423
其中,α表示局部更新步长,
Figure BDA00038297182500000424
表示梯度;
S25、根据对应元学习中的查询集
Figure BDA00038297182500000425
对所述基于元学习的响应式推荐模型进行外循环元学习训练,对所述异构信息网络的元学习器的参数进行全局更新,得到训练完成的基于元学习的响应式推荐模型;
全局更新,具体步骤包括:
首先,对于任务Tu,在步骤S24得到κ2,u后,在查询集
Figure BDA00038297182500000426
上,基于用户嵌入表示模块、商品嵌入表示模块、嵌入表示连接层以及评分预测器,计算损失
Figure BDA0003829718250000051
反映了任务内更新对Tu的适应效果,即先验知识κ2对Tu的适应能力;
其次,为泛化κ2适应任务的能力,全局更新在多个任务的损失上共同优化κ2,κ12的更新过程为:
Figure BDA0003829718250000052
其中,B为采样的一批用户,β表示全局更新的步长,κ1为嵌入表示模块参数;
最后,重复执行步骤S24中的局部更新以及步骤S25中的全局更新,直至收敛,得到优化后的参数κ1、κ2
S26、对ID嵌入表示生成器进行训练
将ID嵌入表示生成器IDEG的参数记为κ3,在IDEG训练的过程中冻结步骤S25得到的优化后的κ1、κ2,只训练κ3,所述ID嵌入表示生成器是多层感知机;
对所述ID嵌入表示生成器进行训练,得到优化的参数κ3,具体步骤包括:
将系统中的历史评分数据R、用户和商品的采样邻居
Figure BDA0003829718250000053
用户和商品的属性向量xU、xI、局部更新学习率η1、全局更新学习率η3、的用户和商品嵌入模块参数κ1以及评分预测器参数κ2输入至所述ID嵌入表示生成器进行训练,输出所述ID嵌入表示生成器的优化参数κ3
S3、获取待推荐用户的用户-商品历史评分数据,并基于所述待推荐用户的用户-商品历史评分数据、所述训练完成的基于元学习的响应式推荐模型以及模型优化参数,获得目标推荐商品,并将所述目标推荐商品推荐给用户;
其中,所述训练完成的基于元学习的响应式推荐模型包括结合ID嵌入表示生成器的用户嵌入表示模块、结合ID嵌入表示生成器的商品嵌入表示模块和评分预测器,所述结合ID嵌入表示生成器的用户嵌入表示模块同时为新老用户生成用户嵌入表示;如果用户u为老用户,则其相应的ID嵌入表示
Figure BDA0003829718250000054
Figure BDA0003829718250000055
分别从
Figure BDA0003829718250000056
和ΦU中查找获得,否则通过
Figure BDA0003829718250000057
和gU(·)对属性嵌入表示进行转换而获得,其中
Figure BDA0003829718250000061
和gU(·)分别为基础嵌入表示和子嵌入表示的IDEG,
Figure BDA0003829718250000062
为用户u相关的输入信息,
Figure BDA0003829718250000063
和ΦU分别为基础嵌入表示和子嵌入表示的嵌入矩阵,P*∈PU
所述结合ID嵌入表示生成器的商品嵌入表示模块同时为新老商品生成商品嵌入表示;如果商品i为老商品,则其相应的ID嵌入表示
Figure BDA0003829718250000064
Figure BDA0003829718250000065
分别从
Figure BDA0003829718250000066
和ΦI中查找获得,否则通过
Figure BDA0003829718250000067
和gI(·)对属性嵌入表示进行转换而获得,其中
Figure BDA0003829718250000068
和gI(·)分别为基础嵌入表示和子嵌入表示的IDEG,
Figure BDA0003829718250000069
为商品i相关的输入信息,
Figure BDA00038297182500000610
和ΦI分别为基础嵌入表示和子嵌入表示的嵌入矩阵;
步骤S3具体包括:
S31、对于待推荐用户u,根据其最近的k项商品评分数据构建支持集
Figure BDA00038297182500000611
并将需要预测的商品构建为查询集
Figure BDA00038297182500000612
S32、对于支持集
Figure BDA00038297182500000613
根据步骤S24的内循环元学习训练,进行L次局部更新,得到适应任务的参数κ2,u
S33、对查询集
Figure BDA00038297182500000614
先基于所述结合ID嵌入表示生成器的用户嵌入表示模块和结合ID嵌入表示生成器的商品嵌入表示模块生成对应的用户嵌入表示和商品嵌入表示,利用嵌入表示连接层生成最终的嵌入表示并输入至评分预测器,利用得到的κ2,u,并根据下式对查询集
Figure BDA00038297182500000615
中的商品进行评分计算,得到用户对查询集
Figure BDA00038297182500000616
中的商品的评分预测值,评分预测的过程可以表示为:
Figure BDA00038297182500000617
其中,M表示多层感知机,
Figure BDA00038297182500000618
Figure BDA00038297182500000619
分别表示用户和商品的相关输入信息,κ为网络参数,包括κ12,u3;其中,
Figure BDA00038297182500000620
和κ用于为用户和商品生成嵌入表示
Figure BDA00038297182500000621
Figure BDA00038297182500000622
以及计算评分,即
Figure BDA00038297182500000623
Figure BDA00038297182500000624
等价。
S34、根据所述评分预测值,获得目标推荐商品,并将所述目标推荐商品推荐给用户。
进一步地,在
Figure BDA00038297182500000625
Figure BDA00038297182500000626
上的损失函数可以表示为:
Figure BDA00038297182500000627
其中,Du表示
Figure BDA0003829718250000071
Figure BDA0003829718250000072
Figure BDA0003829718250000073
Figure BDA0003829718250000074
等价。
进一步地,所述ID嵌入是指,在模型训练的过程中,每个用户和商品都对应了一个唯一的整数标识ID,ID需要被编码为向量的形式才能输入机器学习模型。
一种基于元学习的响应式推荐系统,其特征在于,所述推荐系统执行所述的基于元学习的响应式推荐方法,包括:推荐模型构建模块、推荐模型训练模块、商品推荐模块;
推荐模型构建模块,构建基于元学习的响应式推荐模型;
推荐模型训练模块,利用获取的数据,对所述基于元学习的响应式推荐模型进行训练,得到训练完成的基于元学习的响应式推荐模型以及模型优化参数;
商品推荐模块,获取待推荐用户的用户-商品历史评分数据,并基于所述待推荐用户的用户-商品历史评分数据、所述训练完成的基于元学习的响应式推荐模型以及模型优化参数,获得目标推荐商品,并将所述目标推荐商品推荐给用户。
本发明还提出一种计算机设备,所述设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明公开的一种基于元学习的响应式推荐方法、系统及设备。本发明基于元学习的响应式推荐方法,引入了基于优化的元学习方法,以及引入的ID嵌入表示生成器通过神经网络将用户和商品的属性信息作为输入为新用户和商品生成较好地初始嵌入表示,从而从根源上解决了现有的老用户兴趣变化的响应性问题以及新用户和新商品的初始响应问题,导致推荐准确性低、用户满意度低的问题。
与现有技术相比,具有如下有益效果:
1.本发明的基于元学习的响应式推荐方法,通过引入元学习,解决了老用户兴趣变化的响应性问题,提升了商品推荐的准确性。
2.本发明的基于元学习的响应式推荐方法,引入的ID嵌入表示生成器通过神经网络将用户和商品的属性信息作为输入为新用户和商品生成较好地初始嵌入表示,解决了新用户和新商品的初始响应问题;在保留用户和商品的历史个性化信息的同时,仅通过少量在线收集的数据感知用户最近兴趣,提升了商品推荐的准确性,进而提升了用户体验。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于元学习的响应式推荐方法示意图。
图2为本发明实施例提供的基于元学习的响应式推荐模型的框架图。
图3为本发明实施例提供的结合ID嵌入表示生成器的用户嵌入表示模块示意图。
图4为本发明实施例提供的新用户初始嵌入表示生成器示意图。
图5为本发明实施例提供的基于元学习的响应式推荐系统示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
下面结合附图和具体实施例对本发明作进一步说明,但不作为本发明的限定。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
推荐系统希望通过用户近期少量的交互而学习到其兴趣变化,这在一定程度上与元学习的目标类似,因此本发明利用元学习来解决用户兴趣变化的响应性问题,提出了基于元学习的响应式推荐方法,该方法引入元学习解决了老用户兴趣变化的响应性问题,设计了属性融合生成ID嵌入表示的神经网络解决了新用户和新商品的初始响应问题。本发明在保留用户和商品的历史个性化信息的同时,仅通过少量在线收集的数据感知用户最近兴趣。
元学习(Meta-learning,ML)旨在学习如何学习使得模型能够利用以往的知识来实现通过少量的训练样本及迭代次数就能适应于新的任务。假定有一批任务T,其概率分布p(T),元学习旨在找到最优的元知识ω*(也被称为先验知识):
Figure BDA0003829718250000091
其中,内部更新关注特定任务的学习,而外部更新涉及多个任务,gω是一个优化过程,使用预定义的元知识ω和损失函数
Figure BDA0003829718250000092
以更新权重
Figure BDA0003829718250000093
使模型表现良好。
本发明提出一种基于元学习的响应式推荐方法。如图1所示,基于元学习的响应式推荐方法包括以下步骤S1至S3。
S1、构建基于元学习的响应式推荐模型;所述基于元学习的响应式推荐模型包括异构信息网络的元学习器和ID嵌入表示生成器,所述异构信息网络的元学习器包括用户嵌入表示模块、商品嵌入表示模块、嵌入表示连接层、评分预测器。所述基于元学习的响应式推荐模型框架图如图2所示。
所述用户嵌入表示模块,将用户的嵌入表示记为
Figure BDA0003829718250000094
其计算方式为:
Figure BDA0003829718250000095
其中,
Figure BDA0003829718250000096
为用户u的基础嵌入表示,通过用户ID从嵌入矩阵
Figure BDA0003829718250000097
中查找获得;fU(·)是一个映射函数,为多层感知机MLP,它将用户u的multi-hot形式的属性向量
Figure BDA0003829718250000101
映射到与
Figure BDA0003829718250000102
相同的空间,得到用户的属性嵌入表示;所述属性向量包括用户年龄、性别;
Figure BDA0003829718250000103
为可训练的权重矩阵,将语义嵌入表示
Figure BDA0003829718250000104
转换到与
Figure BDA0003829718250000105
相同的空间;α与β分别为
Figure BDA0003829718250000106
Figure BDA0003829718250000107
的系数,决定了它们在
Figure BDA0003829718250000108
中的重要性;
其中,语义嵌入表示
Figure BDA0003829718250000109
的计算可表示为:
Figure BDA00038297182500001010
其中,ωu是hu的权重,子嵌入表示hu可通过聚合其邻居节点的嵌入表示得到:
Figure BDA00038297182500001011
其中,g(·)是一个均值聚合函数,
Figure BDA00038297182500001012
是用户u在异构信息网络G中的采样邻居集合;
所述商品嵌入表示模块,对于商品i,通过与用户相同的网络结构得到商品嵌入表示
Figure BDA00038297182500001013
其计算方式为:
Figure BDA00038297182500001014
其中,
Figure BDA00038297182500001015
为商品i的基础嵌入表示,通过商品ID从嵌入矩阵
Figure BDA00038297182500001016
中查找获得;fI(·)是一个映射函数,为多层感知机MLP,它将商品i的multi-hot形式的属性向量
Figure BDA00038297182500001017
映射到与
Figure BDA00038297182500001018
相同的空间,得到商品的属性嵌入表示;所述属性向量包括商品价格、类别;Wi I为可训练的权重矩阵,将语义嵌入表示
Figure BDA00038297182500001019
转换到与
Figure BDA00038297182500001020
相同的空间;λ与θ分别为
Figure BDA00038297182500001021
Figure BDA00038297182500001022
的系数,决定了它们在
Figure BDA00038297182500001023
中的重要性;
其中,语义嵌入表示
Figure BDA00038297182500001024
的计算可表示为:
Figure BDA00038297182500001025
其中,ωi是hi的权重,子嵌入表示hi可通过聚合其邻居节点的嵌入表示得到:
Figure BDA00038297182500001026
其中,g(·)是一个均值聚合函数,
Figure BDA00038297182500001027
是商品i在异构信息网络GI中的采样邻居集合;
具体地,所述用户属性包括性别、年龄、职业、邮政编码、地址、朋友关系、喜好等;所述商品包括书籍,书籍的属性包括书籍名称、出版年份、出版社、类型、作者、价格等。
所述嵌入表示连接层,将所述用户嵌入表示模块得到的用户嵌入表示和所述商品嵌入表示模块得到的商品嵌入表示进行拼接,得到最终的嵌入表示;
所述评分预测器,将所述最终的嵌入表示输入至评分预测器,生成用户对商品的评分;具体地,评分预测器使用MLP来建模用户和商品嵌入表示之间的关系,将用户u对商品i的预测评分
Figure BDA0003829718250000111
计算为:
Figure BDA0003829718250000112
其中,M(·)表示多层感知机,
Figure BDA0003829718250000113
表示向量拼接操作。
ID嵌入是指,在模型训练的过程中,每个用户和商品都对应了一个唯一的整数标识(identifier,ID),ID通常需要被编码为向量的形式才能输入机器学习模型。One-hot编码是将ID编码为稀疏二进制向量的基本工具。对于第u个用户,其one-hot编码除了第u个分量为1外,其余所有分量均为0。例如:
Figure BDA0003829718250000114
其中,φu表示用户u的one-hot编码,n表示系统中的用户数。通过矩阵乘法,可以得到ID的低维嵌入表示,即给定一个稠密的矩阵
Figure BDA0003829718250000115
通过
hu=φu TΦ,
可以得到用户u的稠密向量表示
Figure BDA0003829718250000116
对于ID为u的用户,直接从Φ中查找第u行得到其稠密嵌入表示:
hu=LookUp(u,Φ),
其中,LookUp(·,·)表示根据索引在矩阵中进行查找对应行或列的操作,矩阵Φ被称为嵌入矩阵或查找表,hu被称为用户u的ID嵌入表示。
每个ID嵌入表示都被某个用户或商品独享,对用户或商品的个性化特征具有较强的表达能力,对于提升预测效果具有重要作用。然而,新用户和商品在模型训练期间是不可见的,因此其ID嵌入表示无法得到训练,从而导致初始推荐效果差。一般来说,新用户和新商品的一些基本信息是可以获得的,例如用户的性别、年龄、地区和职业等。因此,需要设计参数共享的且能够利用属性为新用户和商品生成ID嵌入表示的函数。
为了解决这个问题,本发明设计了ID嵌入表示生成器(ID EmbeddingRepresentation Generator,IDEG)。IDEG的目标是为新的用户和商品生成合适的ID嵌入表示。
所述ID嵌入表示生成器,它通过神经网络将新用户u或新商品i的属性
Figure BDA0003829718250000121
Figure BDA0003829718250000122
作为输入信息,输出良好的ID嵌入表示,该过程可形式化为:
Figure BDA0003829718250000123
Figure BDA0003829718250000124
Figure BDA0003829718250000125
Figure BDA0003829718250000126
其中,
Figure BDA0003829718250000127
Figure BDA0003829718250000128
分别为用户和商品的初始嵌入表示,
Figure BDA0003829718250000129
Figure BDA00038297182500001210
分别为用户和商品的子嵌入表示,
Figure BDA00038297182500001211
gU(·)和gI(·)分别为对应的ID嵌入表示生成器,是一个多层感知机。
S2、利用获取的数据,对所述基于元学习的响应式推荐模型进行训练,得到训练完成的基于元学习的响应式推荐模型以及模型优化参数κ123
对用户兴趣变化的响应性问题要求系统能够根据某个用户最新的少量评分数据预测其对未留下交互记录的商品的评分,将利用用户的历史评分数据来构建相似的情景。
系统中的所有用户-商品评分数据记为R={(u,i,ru,i)},其中用户u的所有评分数据记为
Figure BDA00038297182500001212
首先将用户u的历史评分数据Ru划分为两部分:
Figure BDA00038297182500001213
Figure BDA00038297182500001214
其中
Figure BDA00038297182500001215
中的数据用于模拟用户最近的评分数据,
Figure BDA00038297182500001216
中的数据用于模拟待预测的数据。然后通过结合评分数据与其他辅助信息,为用户u构建能够作为输入的数据集合
Figure BDA00038297182500001217
Figure BDA00038297182500001218
具体步骤如下:
S21、获取所有用户的用户-商品历史评分数据R={(u,i,ru,i)},将R按用户划分为多个子集R1,R2,...,Rm,并对模型参数进行初始化。
具体地,对模型参数κ1,κ2进行初始化。
S22、在每个训练周期,以用户为单位划分多个批次Batches={B1,B2,...}进行训练,将用户集Ru随机划分为支持集
Figure BDA00038297182500001219
和查询集
Figure BDA00038297182500001220
且保证
Figure BDA00038297182500001221
其中Ru表示用户u的用户-商品历史评分数据。
其中,保证
Figure BDA00038297182500001222
以提高泛化能力。
S23、构建任务
Figure BDA0003829718250000131
其中
Figure BDA0003829718250000132
Figure BDA0003829718250000133
Figure BDA0003829718250000134
Figure BDA0003829718250000135
分别对应元学习中的支持集和查询集,
Figure BDA0003829718250000136
Figure BDA0003829718250000137
分别表示用户u和商品i的相关信息,具体表示为:
Figure BDA0003829718250000138
Figure BDA0003829718250000139
其中,u和i分别表示用户和商品的ID,
Figure BDA00038297182500001310
Figure BDA00038297182500001311
分别表示用户u和商品i的属性向量,
Figure BDA00038297182500001312
Figure BDA00038297182500001313
分别为用户u在多层网络GU,商品i在多层网络GI中的采样邻居集合:
Figure BDA00038297182500001314
Figure BDA00038297182500001315
可以利用历史数据构建任务的集合T={T1,T2,...,Tn},其中n为用户的数量。
利用元学习的方法从这些任务中学习到能够快速适应新任务的先验知识,该过程被称为元训练。将元训练划分为步骤S24的局部更新和步骤S25的全局更新两个过程。元训练通过在
Figure BDA00038297182500001316
上对Tu进行适应(即局部更新)以模拟根据用户u最近的交互数据学习其兴趣的过程,并在
Figure BDA00038297182500001317
进行全局更新,优化先验知识。模型的参数记为κ=(κ12),其中κ1为嵌入表示模块参数(包括用户和商品嵌入表示模块),κ2为评分预测器参数。模型只将κ2作为先验知识,在局部更新过程中适应具体的任务,而κ1不会参与局部更新的过程。这样做主要有两个原因:1)用户和商品的嵌入表示在一定程度上包含了他们的历史个性化特征,如果在局部更新过程中更新κ1,容易使得这些历史的个性化特征被“忘掉”;2)κ1的参数数量会随着支持集样本数量的增加而增加,当样本数量很大时,会降低局部更新的效率,进而影响推荐的效率,而κ2的参数数量较少且固定,更新效率较高,且同样能反映用户兴趣的变化。
S24、根据对应元学习中的支持集
Figure BDA00038297182500001318
对所述基于元学习的响应式推荐模型进行内循环元学习训练,对所述评分预测器的参数进行局部更新。
局部更新,也即任务内更新,具体步骤为:通过全局先验参数κ2对特定于任务Tu的参数进行初始化,然后在
Figure BDA0003829718250000141
上计算损失
Figure BDA0003829718250000142
Figure BDA0003829718250000143
最后,更新κ得到特定于任务Tu的参数κ2,u
Figure BDA0003829718250000144
其中,α表示局部更新步长,
Figure BDA0003829718250000145
表示梯度;
S25、根据对应元学习中的查询集
Figure BDA0003829718250000146
对所述基于元学习的响应式推荐模型进行外循环元学习训练,对所述异构信息网络的元学习器的参数进行全局更新,得到训练完成的基于元学习的响应式推荐模型;
全局更新,具体步骤包括:
首先,对于任务Tu,在步骤S24得到κ2,u后,在查询集
Figure BDA0003829718250000147
上,基于用户嵌入表示模块、商品嵌入表示模块、嵌入表示连接层以及评分预测器,计算损失
Figure BDA0003829718250000148
反映了任务内更新对Tu的适应效果,即先验知识κ2对Tu的适应能力;
其次,为泛化κ2适应任务的能力,全局更新在多个任务的损失上共同优化κ2,κ12的更新过程为:
Figure BDA0003829718250000149
其中,B为采样的一批用户,β表示全局更新的步长,κ1为嵌入表示模块参数;
最后,重复执行步骤S24中的局部更新以及步骤S25中的全局更新,直至收敛,得到优化后的参数κ1、κ2。通过元训练,κ1和κ2都得到了优化,其中κ2被作为任务共享的先验知识,能够通过任务内局部更新快速适应具体的任务。
其中,模型参数如表1所示,
Figure BDA00038297182500001410
Figure BDA0003829718250000151
其中,参数κ1包括嵌入表示模块中的de、α、β等参数,影响嵌入维度和表示权重。参数κ2包括η1、num_batch等。
S26、对ID嵌入表示生成器进行训练
将ID嵌入表示生成器IDEG的参数记为κ3,在IDEG训练的过程中冻结步骤S25得到的优化后的κ1、κ2,只训练κ3,所述ID嵌入表示生成器是多层感知机;
对所述ID嵌入表示生成器进行训练,得到优化的参数κ3,具体步骤包括:
将系统中的历史评分数据R、用户和商品的采样邻居
Figure BDA0003829718250000152
用户和商品的属性向量xU、xI、局部更新学习率η1、全局更新学习率η3、的用户和商品嵌入模块参数κ1以及评分预测器参数κ2输入至所述ID嵌入表示生成器进行训练,输出所述ID嵌入表示生成器的优化参数κ3
在一实施例中,训练的数据集:Douban Book,它们除了用户-书籍评分数据之外,还包括了用户和书籍相关的辅助信息。Douban Book包含约65万个评分数据,2万本书和1万用户,用户属性包括地址、朋友关系等,书籍属性包括出版年份、出版社、类型、作者等信息,评分范围为1到5。
Figure BDA0003829718250000153
通过上述数据集训练得到优化参数κ3
为了使IDEG生成的嵌入表示能够适应任务内更新的过程,因此保留了局部更新的过程。IDEG训练和元训练的区别主要在于两方面:一方面,前者为了模拟新用户和商品而采用附图3中虚线和点线箭头所示的路线为用户和商品生成嵌入表示,而后者采用的是实线和点线箭头所示的路线;另一方面,前者是在后者训练完成的基础上进行的训练,只对参数κ3进行更新。
附图4以初始嵌入表示生成器为例说明了IDEG的结构,
Figure BDA0003829718250000161
即为初始嵌入表示的IDEG,其也是一个多层感知机。
经过元训练过程,用户和商品嵌入表示模块以及评分预测器的参数(κ12)都已经在大量的历史数据上得到了训练。本发明将IDEG的参数记为κ3,在IDEG训练的过程中冻结参数(κ12)而只训练κ3,从而减少额外的内存和计算的开销。
S3、获取待推荐用户的用户-商品历史评分数据,并基于所述待推荐用户的用户-商品历史评分数据、所述训练完成的基于元学习的响应式推荐模型以及模型优化参数,获得目标推荐商品,并将所述目标推荐商品推荐给用户;
其中,所述训练完成的基于元学习的响应式推荐模型包括结合ID嵌入表示生成器的用户嵌入表示模块、结合ID嵌入表示生成器的商品嵌入表示模块和评分预测器,附图3所示为结合了ID嵌入表示生成器IDEG的用户嵌入表示模块,其中
Figure BDA0003829718250000162
和gU(·)分别为基础嵌入表示和子嵌入表示的IDEG,
Figure BDA0003829718250000163
为用户u相关的输入信息,
Figure BDA0003829718250000164
和ΦU分别为基础嵌入表示和子嵌入表示的嵌入矩阵。如果用户u为老用户,则其相应的ID嵌入表示
Figure BDA0003829718250000165
Figure BDA0003829718250000166
分别从
Figure BDA0003829718250000167
和ΦU中查找获得(图中实线箭头所示路径),否则通过
Figure BDA0003829718250000168
和gU(·)对属性嵌入表示进行转换而获得(图中虚线箭头所示路径)。由于用户u在每个G(G∈GU)中的采样邻居都包括其自身,因此在每个G中,使用gU(·)为新用户生成ID嵌入表示,而其他邻居都从老用户中采样得到,因此仍从ΦU中查找获得嵌入表示。最终,老用户通过实线和点线箭头所示路径生成
Figure BDA0003829718250000169
新用户通过虚线和点线箭头所示路径生成
Figure BDA00038297182500001610
所述结合ID嵌入表示生成器的商品嵌入表示模块同时为新老商品生成商品嵌入表示;如果商品i为老商品,则其相应的ID嵌入表示
Figure BDA00038297182500001611
Figure BDA00038297182500001612
分别从
Figure BDA00038297182500001613
和ΦI中查找获得,否则通过
Figure BDA00038297182500001614
和gI(·)对属性嵌入表示进行转换而获得,其中
Figure BDA0003829718250000171
和gI(·)分别为基础嵌入表示和子嵌入表示的IDEG,
Figure BDA0003829718250000172
为商品i相关的输入信息,
Figure BDA0003829718250000173
和ΦI分别为基础嵌入表示和子嵌入表示的嵌入矩阵。
所述评分预测器,将所述最终的嵌入表示输入至评分预测器,生成用户对商品的评分;具体地,评分预测器使用MLP来建模用户和商品嵌入表示之间的关系,将用户u对商品i的预测评分
Figure BDA0003829718250000174
计算为:
Figure BDA0003829718250000175
其中,M(·)表示多层感知机,
Figure BDA0003829718250000176
表示向量拼接操作。
步骤S3具体包括:
经过上述的元学习和ID嵌入生成器就得到了模型参数κ123(其中κ2被当作全局先验知识)。模型利用ID嵌入生成器为系统中第一次出现的新用户和新商品生成相应的ID嵌入表示,然后在元测试过程中,利用先验知识κ2学习到用户的兴趣。模型利用ID嵌入生成器为系统中第一次出现的新用户和新商品生成相应的ID嵌入表示,然后在元测试过程中,利用先验知识κ2学习到用户的兴趣。
针对新用户或新商品,因为其相关ID嵌入表示处于随机初始化状态,所以利用ID嵌入表示生成器生成对应的ID嵌入表示。
S31、对于待推荐用户u,根据其最近的k项商品评分数据构建支持集
Figure BDA0003829718250000177
并将需要预测的商品构建为查询集
Figure BDA0003829718250000178
S32、对于支持集
Figure BDA0003829718250000179
根据步骤S24的内循环元学习训练,进行L次局部更新,得到适应任务的参数κ2,u
S33、对查询集
Figure BDA00038297182500001710
先基于所述结合ID嵌入表示生成器的用户嵌入表示模块和结合ID嵌入表示生成器的商品嵌入表示模块生成对应的用户嵌入表示和商品嵌入表示,利用嵌入表示连接层生成最终的嵌入表示并输入至评分预测器,利用得到的κ2,u,并根据下式对查询集
Figure BDA00038297182500001711
中的商品进行评分计算,得到用户对查询集
Figure BDA00038297182500001712
中的商品的评分预测值,评分预测的过程可以表示为:
Figure BDA00038297182500001713
其中,M表示多层感知机,
Figure BDA00038297182500001714
Figure BDA00038297182500001715
分别表示用户和商品的相关输入信息,κ为网络参数,包括κ12,u3;其中,
Figure BDA0003829718250000181
和κ用于为用户和商品生成嵌入表示
Figure BDA0003829718250000182
Figure BDA0003829718250000183
以及计算评分,因此,
Figure BDA0003829718250000184
Figure BDA0003829718250000185
等价;
S34、根据所述评分预测值,获得目标推荐商品,并将所述目标推荐商品推荐给用户。
进一步地,在
Figure BDA0003829718250000186
Figure BDA0003829718250000187
上的损失函数可以表示为:
Figure BDA0003829718250000188
其中,Du表示
Figure BDA0003829718250000189
Figure BDA00038297182500001810
Figure BDA00038297182500001811
Figure BDA00038297182500001812
等价。
本发明提出了基于元学习的响应式推荐方法。为了解决对用户兴趣变化的响应性问题,本发明引入了基于优化的元学习方法。首先将根据某个用户最近的交互数据来预测其对未交互过商品的评分,将这一过程作为元学习中的任务;然后从用户和商品的历史交互数据中构建相似的任务;最后利用元学习的方法,从这些相似的任务中学习具有强泛化能力的先验知识,这样就可以在新的任务中,根据先验知识更好的学习用户的兴趣。为了解决新用户和新商品的初始响应问题,该方法在利用语义信息增强用户和商品嵌入表示的基础上,针对系统中第一次出现的新用户和新商品设计了ID嵌入表示生成器。引入的ID嵌入表示生成器通过神经网络将用户和商品的属性信息作为输入为新用户和商品生成较好地初始嵌入表示,从而提高新用户和新商品的推荐效果。本发明可以实现在用户兴趣变化的响应性和新用户和新商品的情况下同样达到较高的预测准确率。通过本方法,可以预测推荐系统中某个用户对不同商品的评分,然后根据评分对商品进行推荐,从而提高推荐系统的准确性。
图5是本发明实施例提供的一种基于元学习的响应式推荐系统。如图5所示,该基于元学习的响应式推荐系统,包括:推荐模型构建模块、推荐模型训练模块、商品推荐模块;
推荐模型构建模块,构建基于元学习的响应式推荐模型;
推荐模型训练模块,利用获取的数据,对所述基于元学习的响应式推荐模型进行训练,得到训练完成的基于元学习的响应式推荐模型以及模型优化参数;
商品推荐模块,获取待推荐用户的用户-商品历史评分数据,并基于所述待推荐用户的用户-商品历史评分数据、所述训练完成的基于元学习的响应式推荐模型以及模型优化参数,获得目标推荐商品,并将所述目标推荐商品推荐给用户。
上述基于元学习的响应式推荐系统可以实现为一种计算机程序的形式,该计算机程序可以在计算机设备上运行。
该计算机设备可以是服务器,其中,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
该非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行一种基于元学习的响应式推荐方法。
该处理器用于提供计算和控制能力,以支撑整个计算机设备的运行。
该内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行一种基于元学习的响应式推荐方法。
该网络接口用于与其它设备进行网络通信。本领域技术人员可以理解,上述计算机设备结构仅仅是与本申请方案相关的部分结构,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器用于运行存储在存储器中的计算机程序,该程序实现实施例一所述的基于元学习的响应式推荐方法。
应当理解,在本申请实施例中,处理器可以是中央处理单元(Central ProcessingUnit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行实施例一所述的一种基于元学习的响应式推荐方法。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (5)

1.一种基于元学习的响应式推荐方法,其特征在于,包括步骤:
S1、构建基于元学习的响应式推荐模型;所述基于元学习的响应式推荐模型包括异构信息网络的元学习器和ID嵌入表示生成器,所述异构信息网络的元学习器包括用户嵌入表示模块、商品嵌入表示模块、嵌入表示连接层、评分预测器;
所述用户嵌入表示模块,将用户的嵌入表示记为
Figure FDA0003829718240000011
其计算方式为:
Figure FDA0003829718240000012
其中,
Figure FDA0003829718240000013
为用户u的基础嵌入表示,通过用户ID从嵌入矩阵
Figure FDA0003829718240000014
中查找获得;fU(·)是一个映射函数,为多层感知机MLP,它将用户u的multi-hot形式的属性向量
Figure FDA0003829718240000015
映射到与
Figure FDA0003829718240000016
相同的空间,得到用户的属性嵌入表示;所述属性向量包括用户年龄、性别;
Figure FDA0003829718240000017
为可训练的权重矩阵,将语义嵌入表示
Figure FDA0003829718240000018
转换到与
Figure FDA0003829718240000019
相同的空间;α与β分别为
Figure FDA00038297182400000110
Figure FDA00038297182400000111
的系数,决定了它们在
Figure FDA00038297182400000112
中的重要性;
其中,语义嵌入表示
Figure FDA00038297182400000113
的计算可表示为:
Figure FDA00038297182400000114
其中,ωu是hu的权重,子嵌入表示hu可通过聚合其邻居节点的嵌入表示得到:
Figure FDA00038297182400000115
其中,g(·)是一个均值聚合函数,
Figure FDA00038297182400000116
是用户u在异构信息网络G中的采样邻居集合;
所述商品嵌入表示模块,对于商品i,通过与用户相同的网络结构得到商品嵌入表示
Figure FDA00038297182400000117
其计算方式为:
Figure FDA00038297182400000118
其中,
Figure FDA00038297182400000119
为商品i的基础嵌入表示,通过商品ID从嵌入矩阵
Figure FDA00038297182400000120
中查找获得;fI(·)是一个映射函数,为多层感知机MLP,它将商品i的multi-hot形式的属性向量
Figure FDA00038297182400000121
映射到与
Figure FDA00038297182400000122
相同的空间,得到商品的属性嵌入表示;所述属性向量包括商品价格、类别;
Figure FDA00038297182400000123
为可训练的权重矩阵,将语义嵌入表示
Figure FDA00038297182400000124
转换到与
Figure FDA00038297182400000125
相同的空间;λ与θ分别为
Figure FDA00038297182400000126
Figure FDA00038297182400000127
的系数,决定了它们在
Figure FDA00038297182400000128
中的重要性;
其中,语义嵌入表示
Figure FDA00038297182400000129
的计算可表示为:
Figure FDA0003829718240000021
其中,ωi是hi的权重,子嵌入表示hi可通过聚合其邻居节点的嵌入表示得到:
Figure FDA0003829718240000022
其中,g(·)是一个均值聚合函数,
Figure FDA0003829718240000023
是商品i在异构信息网络GI中的采样邻居集合;
所述嵌入表示连接层,将所述用户嵌入表示模块得到的用户嵌入表示和所述商品嵌入表示模块得到的商品嵌入表示进行拼接,得到最终的嵌入表示;
所述评分预测器,将所述最终的嵌入表示输入至评分预测器,生成用户对商品的评分;具体地,评分预测器使用MLP来建模用户和商品嵌入表示之间的关系,将用户u对商品i的预测评分
Figure FDA0003829718240000024
计算为:
Figure FDA0003829718240000025
其中,M(·)表示多层感知机,
Figure FDA0003829718240000026
表示向量拼接操作;
所述ID嵌入表示生成器,它通过神经网络将新用户u或新商品i的属性
Figure FDA0003829718240000027
Figure FDA0003829718240000028
作为输入信息,输出ID嵌入表示,该过程可形式化为:
Figure FDA0003829718240000029
Figure FDA00038297182400000210
Figure FDA00038297182400000211
Figure FDA00038297182400000212
其中,
Figure FDA00038297182400000213
Figure FDA00038297182400000214
分别为用户和商品的初始嵌入表示,
Figure FDA00038297182400000215
Figure FDA00038297182400000216
分别为用户和商品的子嵌入表示,
Figure FDA00038297182400000217
和gI(·)分别为对应的ID嵌入表示生成器,是一个多层感知机;
S2、利用获取的数据,对所述基于元学习的响应式推荐模型进行训练,得到训练完成的基于元学习的响应式推荐模型以及模型优化参数κ123
S21、获取所有用户的用户-商品历史评分数据R={(u,i,ru,i)},将R按用户划分为多个子集R1,R2,...,Rm,并对模型参数进行初始化;
S22、在每个训练周期,以用户为单位划分多个批次Batches={B1,B2,...}进行训练,将用户集Ru随机划分为支持集
Figure FDA00038297182400000218
和查询集
Figure FDA00038297182400000219
且保证
Figure FDA00038297182400000220
其中Ru表示用户u的用户-商品历史评分数据;
S23、构建任务
Figure FDA0003829718240000031
其中
Figure FDA0003829718240000032
Figure FDA0003829718240000033
Figure FDA0003829718240000034
Figure FDA0003829718240000035
分别对应元学习中的支持集和查询集,
Figure FDA0003829718240000036
Figure FDA0003829718240000037
分别表示用户u和商品i的相关信息,具体表示为:
Figure FDA0003829718240000038
Figure FDA0003829718240000039
其中,u和i分别表示用户和商品的ID,
Figure FDA00038297182400000310
Figure FDA00038297182400000311
分别表示用户u和商品i的属性向量,
Figure FDA00038297182400000312
Figure FDA00038297182400000313
分别为用户u在多层网络GU,商品i在多层网络GI中的采样邻居集合:
Figure FDA00038297182400000314
Figure FDA00038297182400000315
S24、根据对应元学习中的支持集
Figure FDA00038297182400000316
对所述基于元学习的响应式推荐模型进行内循环元学习训练,对所述评分预测器的参数进行局部更新;
局部更新,具体步骤为:通过全局先验参数κ2对特定于任务Tu的参数进行初始化,然后在
Figure FDA00038297182400000317
上计算损失
Figure FDA00038297182400000318
Figure FDA00038297182400000319
最后,更新κ得到特定于任务Tu的参数κ2,u
Figure FDA00038297182400000320
其中,α表示局部更新步长,
Figure FDA00038297182400000321
表示梯度;
S25、根据对应元学习中的查询集
Figure FDA00038297182400000322
对所述基于元学习的响应式推荐模型进行外循环元学习训练,对所述异构信息网络的元学习器的参数进行全局更新,得到训练完成的基于元学习的响应式推荐模型;
全局更新,具体步骤包括:
首先,对于任务Tu,在步骤S24得到κ2,u后,在查询集
Figure FDA00038297182400000323
上,基于用户嵌入表示模块、商品嵌入表示模块、嵌入表示连接层以及评分预测器,计算损失
Figure FDA0003829718240000041
反映了任务内更新对Tu的适应效果,即先验知识κ2对Tu的适应能力;
其次,为泛化κ2适应任务的能力,全局更新在多个任务的损失上共同优化κ2,κ12的更新过程为:
Figure FDA0003829718240000042
其中,B为采样的一批用户,β表示全局更新的步长,κ1为嵌入表示模块参数;
最后,重复执行步骤S24中的局部更新以及步骤S25中的全局更新,直至收敛,得到优化后的参数κ1、κ2
S26、对ID嵌入表示生成器进行训练
将ID嵌入表示生成器IDEG的参数记为κ3,在IDEG训练的过程中冻结步骤S25得到的优化后的κ1、κ2,只训练κ3,所述ID嵌入表示生成器是多层感知机;
对所述ID嵌入表示生成器进行训练,得到优化的参数κ3,具体步骤包括:
将系统中的历史评分数据R、用户和商品的采样邻居
Figure FDA0003829718240000043
用户和商品的属性向量xU、xI、局部更新学习率η1、全局更新学习率η3、的用户和商品嵌入模块参数κ1以及评分预测器参数κ2输入至所述ID嵌入表示生成器进行训练,输出所述ID嵌入表示生成器的优化参数κ3
S3、获取待推荐用户的用户-商品历史评分数据,并基于所述待推荐用户的用户-商品历史评分数据、所述训练完成的基于元学习的响应式推荐模型以及模型优化参数,获得目标推荐商品,并将所述目标推荐商品推荐给用户;
其中,所述训练完成的基于元学习的响应式推荐模型包括结合ID嵌入表示生成器的用户嵌入表示模块、结合ID嵌入表示生成器的商品嵌入表示模块和评分预测器,所述结合ID嵌入表示生成器的用户嵌入表示模块同时为新老用户生成用户嵌入表示;如果用户u为老用户,则其相应的ID嵌入表示
Figure FDA0003829718240000044
Figure FDA0003829718240000045
分别从
Figure FDA0003829718240000046
和ΦU中查找获得,否则通过
Figure FDA0003829718240000047
和gU(·)对属性嵌入表示进行转换而获得,其中
Figure FDA0003829718240000048
和gU(·)分别为基础嵌入表示和子嵌入表示的IDEG,
Figure FDA0003829718240000049
为用户u相关的输入信息,
Figure FDA0003829718240000051
和ΦU分别为基础嵌入表示和子嵌入表示的嵌入矩阵,P*∈PU
所述结合ID嵌入表示生成器的商品嵌入表示模块同时为新老商品生成商品嵌入表示;如果商品i为老商品,则其相应的ID嵌入表示
Figure FDA0003829718240000052
Figure FDA0003829718240000053
分别从
Figure FDA0003829718240000054
和ΦI中查找获得,否则通过
Figure FDA0003829718240000055
和gI(·)对属性嵌入表示进行转换而获得,其中
Figure FDA0003829718240000056
和gI(·)分别为基础嵌入表示和子嵌入表示的IDEG,
Figure FDA0003829718240000057
为商品i相关的输入信息,
Figure FDA0003829718240000058
和ΦI分别为基础嵌入表示和子嵌入表示的嵌入矩阵;
步骤S3具体包括:
S31、对于待推荐用户u,根据其最近的k项商品评分数据构建支持集
Figure FDA0003829718240000059
并将需要预测的商品构建为查询集
Figure FDA00038297182400000510
S32、对于支持集
Figure FDA00038297182400000511
根据步骤S24的内循环元学习训练,进行L次局部更新,得到适应任务的参数κ2,u
S33、对查询集
Figure FDA00038297182400000512
先基于所述结合ID嵌入表示生成器的用户嵌入表示模块和结合ID嵌入表示生成器的商品嵌入表示模块生成对应的用户嵌入表示和商品嵌入表示,利用嵌入表示连接层生成最终的嵌入表示并输入至评分预测器,利用得到的κ2,u,并根据下式对查询集
Figure FDA00038297182400000513
中的商品进行评分计算,得到用户对查询集
Figure FDA00038297182400000514
中的商品的评分预测值,评分预测的过程可以表示为:
Figure FDA00038297182400000515
其中,M表示多层感知机,
Figure FDA00038297182400000516
Figure FDA00038297182400000517
分别表示用户和商品的相关输入信息,κ为网络参数,包括κ12,u3;其中,
Figure FDA00038297182400000518
和κ用于为用户和商品生成嵌入表示
Figure FDA00038297182400000519
Figure FDA00038297182400000520
以及计算评分,即
Figure FDA00038297182400000521
Figure FDA00038297182400000522
等价;
S34、根据所述评分预测值,获得目标推荐商品,并将所述目标推荐商品推荐给用户。
2.根据权利要求1所述的方法,其特征在于,在
Figure FDA00038297182400000523
Figure FDA00038297182400000524
上的损失函数可以表示为:
Figure FDA00038297182400000525
其中,Du表示
Figure FDA0003829718240000061
Figure FDA0003829718240000062
Figure FDA0003829718240000063
Figure FDA0003829718240000064
等价。
3.根据权利要求1所述的方法,其特征在于,所述ID嵌入是指,在模型训练的过程中,每个用户和商品都对应了一个唯一的整数标识ID,ID需要被编码为向量的形式才能输入机器学习模型。
4.一种基于元学习的响应式推荐系统,其特征在于,所述推荐系统执行如权利要求1所述的基于元学习的响应式推荐方法,包括:推荐模型构建模块、推荐模型训练模块、商品推荐模块;
推荐模型构建模块,构建基于元学习的响应式推荐模型;
推荐模型训练模块,利用获取的数据,对所述基于元学习的响应式推荐模型进行训练,得到训练完成的基于元学习的响应式推荐模型以及模型优化参数;
商品推荐模块,获取待推荐用户的用户-商品历史评分数据,并基于所述待推荐用户的用户-商品历史评分数据、所述训练完成的基于元学习的响应式推荐模型以及模型优化参数,获得目标推荐商品,并将所述目标推荐商品推荐给用户。
5.一种计算机设备,其特征在于,所述设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至3中任一项所述的方法。
CN202211072658.4A 2022-09-02 2022-09-02 一种基于元学习的响应式推荐方法、系统及设备 Pending CN115409579A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211072658.4A CN115409579A (zh) 2022-09-02 2022-09-02 一种基于元学习的响应式推荐方法、系统及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211072658.4A CN115409579A (zh) 2022-09-02 2022-09-02 一种基于元学习的响应式推荐方法、系统及设备

Publications (1)

Publication Number Publication Date
CN115409579A true CN115409579A (zh) 2022-11-29

Family

ID=84164707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211072658.4A Pending CN115409579A (zh) 2022-09-02 2022-09-02 一种基于元学习的响应式推荐方法、系统及设备

Country Status (1)

Country Link
CN (1) CN115409579A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116246749A (zh) * 2023-05-11 2023-06-09 西南医科大学附属医院 集成电子病历的内分泌病人个性化健康管理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116246749A (zh) * 2023-05-11 2023-06-09 西南医科大学附属医院 集成电子病历的内分泌病人个性化健康管理系统
CN116246749B (zh) * 2023-05-11 2023-07-21 西南医科大学附属医院 集成电子病历的内分泌病人个性化健康管理系统

Similar Documents

Publication Publication Date Title
US11734717B2 (en) Dynamic predictive similarity grouping based on vectorization of merchant data
CN111061946B (zh) 场景化内容推荐方法、装置、电子设备及存储介质
CN111444395B (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
US11636394B2 (en) Differentiable user-item co-clustering
US20200226493A1 (en) Apparatus and Method for Training a Similarity Model Used to Predict Similarity Between Items
WO2024041483A1 (zh) 一种推荐方法及相关装置
CN113946754A (zh) 基于用户画像的权益推荐方法、装置、设备及存储介质
WO2023185925A1 (zh) 一种数据处理方法及相关装置
CN115409579A (zh) 一种基于元学习的响应式推荐方法、系统及设备
Nazari et al. Scalable and data-independent multi-agent recommender system using social networks analysis
Li et al. Tell me where to go next: Improving poi recommendation via conversation
CN116910357A (zh) 一种数据处理方法及相关装置
Chen et al. Exploiting aesthetic features in visual contents for movie recommendation
CN115080856A (zh) 推荐方法及装置、推荐模型的训练方法及装置
CN113379482B (zh) 一种物品推荐方法、计算设备以及存储介质
Sridhar et al. Extending Deep Neural Categorisation Models for Recommendations by Applying Gradient Based Learning
CN116932893B (zh) 一种基于图卷积网络的序列推荐方法、系统、设备及介质
KR102676528B1 (ko) 빅데이터 생성 전자 장치 및 그 방법
Kochhar Adding Personal Touches to IoT: A User‐Centric IoT Architecture
Zhang et al. Neural network collaborative filtering for group recommendation
Abdaoui et al. Personalized Recommendation: A novel approach based on Hybrid methods and fog computing architecture
Abdaoui et al. Creating a Personalized Recommendation Framework in Smart Shopping by Using IoT Devices
Saravanan et al. A Novel K Means Biclustering Fusion Based Collaborative Recommender System
Zou et al. Feature Norm-Based Deep Network for Multi-Domain Fashion Image Retrieval
CN114331491A (zh) 生成推荐信息的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination