CN113763095A - 信息推荐方法、装置和模型训练方法、装置 - Google Patents

信息推荐方法、装置和模型训练方法、装置 Download PDF

Info

Publication number
CN113763095A
CN113763095A CN202011357912.6A CN202011357912A CN113763095A CN 113763095 A CN113763095 A CN 113763095A CN 202011357912 A CN202011357912 A CN 202011357912A CN 113763095 A CN113763095 A CN 113763095A
Authority
CN
China
Prior art keywords
user
vector
commodity
target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011357912.6A
Other languages
English (en)
Other versions
CN113763095B (zh
Inventor
赵俊哲
刘洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN202011357912.6A priority Critical patent/CN113763095B/zh
Publication of CN113763095A publication Critical patent/CN113763095A/zh
Application granted granted Critical
Publication of CN113763095B publication Critical patent/CN113763095B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种信息推荐方法、装置和模型训练方法、装置,其中,该信息推荐方法包括:获取用户信息、商品信息和用户画像向量,进行一次稠密化处理,得到用户向量和物品向量;根据目标模型对用户画像向量、用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率;推荐对应的商品的信息至对应的用户。该技术方案中,通过输入用户信息和商品信息至已经训练好的目标模型,由训练好的目标模型对用户信息和商品信息进行处理得到用户与商品的购买概率,能够更有效的利用用户画像数据、用户历史行为数据预测用户购买商品的概率,从而准确的将筛选出用户所需要的商品,方便平台在后续能够将对应的商品信息推荐给用户。

Description

信息推荐方法、装置和模型训练方法、装置
技术领域
本申请涉及信息推送技术领域,尤其涉及一种信息推荐方法、装置和模型训练方法、装置。
背景技术
随着大数据分析的迅速发展,用户在各种应用平台上浏览信息时会产生各种历史数据,这些数据具有很高的潜在价值,例如通过对这些数据进行分析可以有效的将一些用户有可能需要的商品精准的推荐给所需用户。
现有技术中,商品推荐的方法主要是采用人工筛除方法,通过人工分析确定用户是否浏览或购买商品来进行筛选以针对性的为用户推荐商品,这种方式完全依赖于人工的操作经验,存在有较强的主观判断,容易降低数据分析的准确度降。
发明内容
本申请提供一种信息推荐方法、装置和模型训练方法、装置,用于解决现有的商品筛选准确度差的问题。
第一方面,本申请实施例提供一种信息推荐方法,包括:
获取用户信息、商品信息和用户画像向量,所述用户信息包括用户画像数据和用户历史行为数据,所述商品信息包括商品ID,所述用户画像向量为通过对所述用户画像数据进行独热编码得到;
根据目标模型对所述用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量,所述目标模型为通过过对预设初始模型训练得到;
根据所述目标模型对所述用户画像向量、所述用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率,所述用户画像向量通过对用户画像数据进行独热编码得到;
根据所述用户与商品的购买概率,推荐所述商品信息至所述用户。
在第一方面的一种可能设计中,所述根据目标模型对所述用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量,包括:
对所述用户信息和所述商品信息进行独热编码,得到初始用户向量和初始物品向量;
根据目标模型的第一用户矩阵和第一物品矩阵对所述初始用户向量、初始物品向量进行稠密化处理,得到用户向量和物品向量。
在第一方面的另一种可能设计中,所述根据所述目标模型对用户画像向量、所述用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率,包括:
根据目标模型的第二用户矩阵、第二物品矩阵和第一用户画像矩阵,对所述用户画像向量、用户向量和物品向量进行二次稠密化处理,得到最终用户向量、最终用户画像向量、目标商品向量和最终物品向量;
根据所述最终用户向量、最终用户画像向量、目标商品向量和最终物品向量,通过目标模型计算得到用户与商品的购买概率。
在第一方面的再一种可能设计中,所述根据所述最终用户向量、最终用户画像向量、目标商品向量和最终物品向量,通过目标模型计算得到用户与商品的购买概率,包括:
根据目标模型对所述最终物品向量进行加权求和,得到最终历史行为向量;
对目标商品向量、所述最终历史行为向量、最终用户向量和最终用户画像向量进行拼接,得到拼接后的向量;
通过所述目标模型对所述拼接后的向量进行计算,得到用户与商品的购买概率。
在第一方面的又一种可能设计中,所述根据所述用户与商品的购买概率,推荐对应的商品的信息至对应的用户,包括:
获取不同的用户与同一商品的第一购买概率;
根据所述第一购买概率对不同的用户进行排序得到用户排序;
将所述同一商品的信息分别推荐至所述用户排序中相应的用户;或,
获取各个不同的用户与不同商品的第二购买概率;
根据所述第二购买概率,对所述不同商品进行排序,得到商品排序;
将所述商品排序中相应的商品的信息分别推荐至各个不同的用户。
第二方面,本申请实施例提供一种模型训练方法,包括:
构造训练样本,所述训练样本包括样本输入信息及其对应的样本标签,所述样本输入信息包括用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID;
通过预设初始模型对所述样本输入信息进行一次稠密化处理,获取用户向量和物品向量;
根据所述用户向量和所述物品向量,获取用户对历史行为列表中商品有历史交互行为的第一概率;
通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率,所述用户画像向量通过对所述用户画像数据进行独热编码得到;
根据所述第一损失和第二损失得到目标损失,通过所述目标损失对所述预设初始模型进行训练优化得到目标模型,所述第一损失为预设初始模型根据所述第一概率计算得到,所述第二损失为预设初始模型根据所述第二概率计算得到。
在第二方面的一种可能设计中,所述训练样本包括正样本和负样本,所述构造训练样本,包括:
获取用户ID和用户画像数据;
当用户有商品购买记录时,根据用户的商品购买记录获取历史行为列表中商品ID列表和目标商品ID;
根据所述用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造正样本和负样本;
当用户没有商品购买记录时,根据用户的商品浏览记录获取历史行为列表中商品ID列表和目标商品ID;
根据所述用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造负样本。
在第二方面的另一种可能设计中,所述通过预设初始模型对所述样本输入信息进行一次稠密化处理,获取用户向量和物品向量,包括:
对所述样本输入信息进行独热编码,得到初始用户向量和初始物品向量;
根据预设初始模型的第一用户矩阵和第一物品矩阵对所述初始用户向量和初始物品向量进行一次稠密化处理,得到用户向量和物品向量。
在第二方面的再一种可能设计中,还包括:
获取用户无历史行为列表中商品列表;
获取用户对无历史行为列表中商品的历史交互行为概率;
根据所述无历史行为列表中商品的历史交互行为概率计算第三损失;
根据所述第三损失对所述目标模型的网络参数进行更新,所述网络参数至少包括预设初始模型的第一用户矩阵和第一物品矩阵。
在第二方面的又一种可能设计中,所述获取用户对无历史行为列表中商品的历史交互行为概率,包括:
根据用户ID、用户画像数据、无历史行为列表中商品列表和目标商品,构造训练负样本,所述训练负样本包括负样本输入信息及所述负样本输入信息对应的样本标签;
通过预设初始模型对所述负样本输入信息进行一次稠密化处理,获取第三用户向量和第三物品向量;
根据所述第三用户向量和所述第三物品向量,计算用户对无历史行为列表中商品的历史交互行为概率。
在第二方面的又一种可能设计中,所述通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率,包括:
根据预设初始模型的第二用户矩阵、第二物品矩阵和用户画像矩阵,对所述用户向量、物品向量和用户画像向量进行二次稠密化处理,得到最终用户向量、最终商品向量、目标商品向量和最终用户画像向量;
根据所述最终用户向量、最终用户画像向量、所述最终商品向量和所述目标商品向量,计算得到用户购买目标商品的第二概率。
在第二方面的又一种可能设计中,所述根据所述最终用户向量、最终用户画像向量、所述最终商品向量和所述目标商品向量,计算得到用户购买目标商品的第二概率,包括:
对所述最终商品向量进行加权求和,获取最终历史行为向量;
根据所述最终用户向量、最终用户画像向量、最终历史行为向量和所述目标商品向量,计算得到用户购买目标商品的第二概率。
在第二方面的又一种可能设计中,所述根据所述第一损失和第二损失得到目标损失,通过所述目标损失对所述预设初始模型进行训练优化得到目标模型,包括:
根据目标商品向量和物品向量,获取训练样本的第一损失的权重;
获取所述训练样本的第一损失对应的正则化系数,根据所述权重、正则化系数、第一损失和第二损失得到所述训练样本的目标损失;
对各个训练样本的目标损失进行求和得到总目标损失,根据所述总目标损失对所述预设初始模型进行训练优化得到目标模型。
第三方面,本申请实施例提供了一种信息推荐装置,包括:
数据获取模块,用于获取用户信息、商品信息和用户画像向量,所述用户信息包括用户画像数据和用户历史行为数据,所述商品信息包括商品ID,所述用户画像向量为通过对所述用户画像数据进行独热编码得到;
数据输入模块,用于根据目标模型对所述用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量,所述目标模型为通过对预设初始模型训练得到;
概率获取模块,用于根据所述目标模型对用户画像向量、所述用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率,所述用户画像向量通过对用户画像数据进行独热编码得到;
推荐模块,用于根据所述用户与商品的购买概率,推荐对应的商品的信息至对应的用户。
第四方面,本申请实施例提供了一种模型训练装置,包括:
样本构造模块,用于构造训练样本,所述训练样本包括样本输入信息及其对应的样本标签,所述样本输入信息包括用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID;
一次处理模块,用于通过预设初始模型对所述样本输入信息进行一次稠密化处理,获取用户向量和物品向量;
第一概率获取模块,用于根据所述用户向量和所述物品向量,获取用户对历史行为列表中商品有历史交互行为的第一概率;
第二概率获取模块,用于通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率,所述用户画像向量通过对所述用户画像数据进行独热编码得到;
训练模块,用于根据所述第一损失和第二损失得到目标损失,通过所述目标损失对所述预设初始模型进行训练优化得到目标模型,所述第一损失为预设初始模型根据所述第一概率计算得到,所述第二损失为预设初始模型根据所述第二概率计算得到。
第五方面,本申请实施例提供了一种计算机设备,包括存储器和至少一个处理器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上所述的方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机可读存储介质中存储有计算机指令,当其在计算机上运行时,使得计算机执行如上所述的方法。
本申请实施例提供的信息推荐方法、装置和模型训练方法、装置,通过输入用户信息和商品信息至已经训练好的目标模型,由训练好的目标模型对用户信息和商品信息进行处理得到用户与商品的购买概率,能够更有效的利用用户画像数据、用户历史行为数据预测用户购买商品的概率,从而准确的将筛选出用户所需要的商品,方便平台在后续能够将对应的商品信息推荐给用户。
附图说明
图1为本申请实施例提供的信息推荐方法的场景示意图;
图2为本申请实施例提供的目标模型实施例一的结构示意图;
图3为本申请实施例提供的目标模型实施例二的结构示意图;
图4为本申请实施例提供的信息推荐方法实施例一的流程示意图;
图5为本申请实施例提供的信息推荐方法实施例二的流程示意图;
图6为本申请实施例提供的信息推荐方法实施例三的流程示意图;
图7为本申请实施例提供的信息推荐方法实施例四的流程示意图;
图8为本申请实施例提供的信息推荐方法实施例五的流程示意图;
图9为本申请实施例提供的信息推荐方法实施例六的流程示意图;
图10为本申请实施例提供的模型训练方法实施例一的流程示意图;
图11为本申请实施例提供的模型训练方法实施例二的流程示意图;
图12为本申请实施例提供的模型训练方法实施例三的流程示意图;
图13为本申请实施例提供的模型训练方法实施例四的流程示意图;
图14为本申请实施例提供的模型训练方法实施例五的流程示意图;
图15为本申请实施例提供的模型训练方法实施例六的流程示意图;
图16为本申请实施例提供的模型训练方法实施例七的流程示意图;
图17为本申请实施例提供的模型训练方法实施例八的流程示意图;
图18为本申请实施例提供的信息推荐装置的结构示意图;
图19为本申请实施例提供的模型训练装置的结构示意图;
图20为本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着互联网电商的发展,用户除了在实体店铺购物之外还可以通过网上购物平台进行购物,相比于实体店购物,用户在网上购物平台进行购物时更容易进行大数据统计,收集用户在历史时刻浏览过的商品或者购买过的商品信息,通过对这些大数据进行统计分析,很容易即可得到用户个人的购物喜好,这样能够方便网上购物平台组织针对性的商品营销活动,将用户喜好的商品信息推送到显示界面供用户浏览,促进用户进行消费。
现有技术中对大数据进行统计分析有各种各样的方法,例如包括有人工筛除的方法、基于用户画像数据采用XGBoost、LightGBM等分类模型进行分类的方法、采用协同过滤、DeepFM、Wide&Deep、深度兴趣网络(DIN)等推荐算法的方法。其中,人工筛选的方法是通过人工对用户浏览或者购买过的商品进行筛选的,一般都依赖于人工经验,缺乏相对成熟的筛选规则,误差较大的同时效率的较差,而基于用户画像数据采用XGBoost、LightGBM等分类模型进行分类的方法则在进行分类训练以及预测时忽略了用户与商品之间的交互以及用户与用户之间在历史行为上的相似度,至于采用协同过滤这种推荐算法的方法则存在有比较显著的冷启动问题,当用户无历史购买信息时无法对目标商品的购买进行有效预测,另外采用DeepFM、Wide&Deep等推荐算法的方法虽然在学习过程中加入用户历史隐式行为序列作为特征并通过融合神经网络使模型具备非线性的表达能力,但是忽视了用户历史行为序列中的不同商品的重要程度,同样消解了大量的有价值的信息,最后还有采用深度兴趣网络(DIN)推荐算法的方法,其通过历史行为商品与目标商品之间相关性赋予其不同的权重,但是会忽略用户和历史行为序列中单个物品的交互信息,并且由于其网络结构较为复杂,容易造成过拟合。
针对上述问题,本申请实施例提供了一种信息推荐方法、装置和模型训练方法、装置,其主要思路如下:本方案将预测用户与商品的购买概率分为两个部分,第一个部分基于用户历史行为信息,通过神经协同过滤(NCF,Neural Collaborative Filtering)构造用户向量和物品向量,第二部分则利用第一部分的用户向量和物品向量构造数据集,作为深度兴趣网络(又称为DIN,Deep Interest Network)的输入,进行用户与目标商品的购买概率的预测建模,这样就可以弥补DIN中将用户历史行为列表中所有商品进行加权求和后得到的向量与用户向量进行运算导致用户和每一个历史行为商品之间交互信息丢失的不足,并且也能够避免由于用户无历史购买记录所造成的冷启动问题。
图1为本申请实施例提供的信息推荐方法的场景示意图,如图1所示,包括有服务器11和移动终端12,用户可以通过账号登陆移动终端12中的购物应用,在购物应用提供的网上购物平台上浏览或购买商品,同时也可以将一些喜好商品加购到购物应用的购物车中,用户在移动终端12上进行购物操作会不断的产生各种历史数据,例如用户画像数据(具体包括有用户账号、性别、年龄、注册城市、职业、教育等级、婚姻状况、首次购买时间、用户活跃度、是否有车、常用收货市、用户等级、全站RFM分组(RFM,客户关系管理,其中R表示平均购物时间间隔,F表示客户在统计时间内购买的次数,M表示客户在统计时间内购买的金额)、全站RFM标准化得分、用户价值标准得分、用户购买力、促销敏感度类型、用户最后一次登录距今时间)、用户历史行为数据(具体包括用户浏览的商品ID、购买的商品ID、对应的购买时间、购买或浏览标志等),并由服务器11接收到,服务器11可以对这些历史数据进行分析统计,即可得到用户的购物喜好等等,或者可以通过后台的工作人员对服务器11中的这些历史数据进行人工筛选,得到用户的购物喜好。
图2为本申请实施例提供的目标模型实施例一的结构示意图,如图2所示,本方案提供的目标模型包括有两个部分,第一部分为神经协同过滤21,其包括有编码模块201、一次稠密化模块202、概率计算模块203,第二部分为深度兴趣网络22,其包括有二次稠密化模块204、加权求和模块205、聚合模块206和概率输出模块207。其中,
编码模块201作为整个目标模型的输入部分,可以输入用户画像数据、用户历史行为数据、商品ID等信息至编码模型201中,编码模块201对这些信息进行编码(例如独热编码或者二进制编码等等)之后可以得到初始用户向量
Figure BDA0002803155260000091
和初始物品向量
Figure BDA0002803155260000092
并输入至一次稠密化模块202中,一次稠密化模块202中包括有第一用户矩阵P和第一物品矩阵Q,一次稠密化模块202中包括有embedding层,通过embedding层中的第一用户矩阵P和第一物品矩阵Q对初始用户向量
Figure BDA0002803155260000093
和初始物品向量
Figure BDA0002803155260000094
进行稠密化处理,得到用户向量
Figure BDA0002803155260000095
和物品向量
Figure BDA0002803155260000096
用户向量pu和物品向量qi再输入至二次稠密化模块203,二次稠密化模块203中包括有第二用户矩阵P1、第一用户画像矩阵PR和第二物品矩阵Q1,二次稠密化模块203通过第二用户矩阵P1、用户画像矩阵PR和第二物品矩阵Q1,对用户画像向量pru(通过对用户画像数据进行编码得到用户画像向量pru)、第一目标商品向量qA(通过对商品ID进行编码以及一次稠密化处理得到第一目标商品向量qA)、用户向量pu和物品向量qi进行二次稠密化处理,得到更加稠密的最终用户向量
Figure BDA0002803155260000097
最终用户画像向量pr1u=PR Tpru、历史行为列表中最终物品向量
Figure BDA0002803155260000098
以及目标商品向量
Figure BDA0002803155260000099
加权求和模块205基于注意力机制通过历史行为列表中商品和目标商品的相关性对历史行为列表中不同的商品给予不同的权重,并通过池化层对加权后的最终物品向量q1i进行求和,得到加权求和后的历史行为列表中商品向量qu(A)。
示例性的,历史行为列表中商品向量qu(A)的加权求和过程计算如下:
Figure BDA0002803155260000101
上式中,
Figure BDA0002803155260000102
为用户u的长度为H的历史行为商品的向量列表,q1A为目标商品向量,a(·)为输出各历史行为列表中商品权重wj的前馈网络,同时通过softmax函数对权重进行归一化使其满足约束
Figure BDA0002803155260000103
聚合模块206用于将用户向量p1u、用户画像向量pr1u、加权求和后的历史行为列表中商品向量qu(A)、目标商品向量q1A进行拼接,得到实例整体的表示向量Xu(A)。
概率输出模块207用于将聚合后的向量Xu(A)通过两层神经网络进行运算,最后得到用户购买目标商品的概率p(x)。
示例性的,将聚合后的向量Xu(A)通过两层神经网络进行运算的过程如下:
Figure BDA0002803155260000104
Figure BDA0002803155260000105
Figure BDA0002803155260000106
上式中,W1x,b1x和a1x分别表示第x层的权重矩阵,偏置向量以及激活函数,W1o、b1o为输出层权重和偏置,σ(·)为sigmoid函数(又称为逻辑回归函数)。其中,激活函数可以选择PReLU函数。
应当说明的是,目标模型指的是已经通过训练优化后的模型,训练优化能够使得目标模型中的参数趋近于最优值,目标模型中的参数具体至少包括有第一用户矩阵P、第二物品矩阵Q、第二用户矩阵P1、第二物品矩阵Q1、用户画像矩阵PR、Wx、bx、Wo、bo、W1x、b1x、W1o和b1o
图3为本申请实施例提供的目标模型实施例二的结构示意图,如图3所示,可以输入用户信息(例如用户ID)和商品信息(例如商品ID)至编码模块201进行独热编码,得到初始物品向量和初始用户向量,然后再经过一次稠密化模块202进行稠密化处理,得到稠密的用户向量和物品向量,并输入至二次稠密化模块204再次进行稠密化得到更加稠密的最终用户向量,最终用户画像向量和最终物品向量,之后加权求和模块205通过注意力机制对最终物品向量进行加权求和,得到最终历史行为向量,聚合模块206则用于将最终用户向量,最终用户画像向量、最终历史行为向量和目标商品向量(由二次稠密化模块204输出)拼接得到拼接后的向量,概率输出模块207则根据拼接后的向量进行运算得到用户购买商品的概率。
而概率计算模块203则是通过多层感知机(MLP)对稠密的用户向量和物品向量来进行概率计算,得到用户与物品有交互的概率以用于后续对模型的训练优化。
图4为本申请实施例提供的信息推荐方法实施例一的流程示意图,如图4所示,该方法可以应用于服务器或者具备数据处理功能的计算机,故可以以服务器或者计算机作为本申请实施例的执行主体,该方法包括以下步骤:
S401、获取用户信息、商品信息和用户画像向量。
其中,用户信息包括用户画像数据和用户历史行为数据,商品信息包括商品ID,用户画像向量为通过对用户画像数据进行独热编码得到。示例性的,用户画像数据可以包括有用户账号、性别、年龄、注册城市、职业、教育等级、婚姻状况、首次购买时间、用户活跃度、是否有车、常用收货市、用户等级、全站RFM分组(RFM,客户关系管理,其中R表示平均购物时间间隔,F表示客户在统计时间内购买的次数,M表示客户在统计时间内购买的金额)、全站RFM标准化得分、用户价值标准得分、用户购买力、促销敏感度类型、用户最后一次登录距今时间。
示例性的,商品信息可以包括有商品ID、用户浏览过的商品ID、用户购买过的商品ID和待推荐给用户的商品ID等等。
示例性的,可以设置一段历史时长,然后获取该段历史时长中的用户信息和商品信息,例如获取用户在该段历史时长内浏览的商品ID、购买的商品ID等等。
S402、根据目标模型对用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量。
其中,目标模型为通对预设初始模型训练得到,在本申请实施例中,需要对预设初始模型进行多次反复迭代训练,才能够不断的优化预设初始模型内的参数,并最终趋向于最优值,得到目标模型。
在本申请实施例中,目标模型内包括有用于进行一次稠密化处理的参数,可以将用户信息、商品信息与这些参数进行拟合,从而实现稠密化处理,得到用户向量pu和物品向量qi
示例性的,这些参数是通过不断的优化得到的,具体可以是第一用户矩阵P和第一物品矩阵Q,通过将用户信息与第一用户矩阵P相乘,得到用户向量pu,将商品信息与第一物品矩阵Q相乘得到物品向量qi,其中u表示第u个用户,i表示该用户对一个的商品信息,例如该用户浏览过的商品ID、购买过的商品ID等等。
示例性的,本申请实施例的执行主体服务器或者计算机可以获取到若干个不同的用户信息以及该用户对应的商品信息,从而可以实现批量的数据处理,最终实现对若干个用户进行信息推荐。
S403、根据目标模型对用户画像向量、用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率。
其中,用户画像向量通过对用户画像数据进行独热编码得到,在本申请实施例中独热编码(又称为ONE-hot编码)可以实现信息的数字化。
示例性的,若用户画像数据中用户性别为男,则得到的用户画像向量可以是“1”,若用户画像数据中用户性别为女,则得到的用户画像向量可以是“0”。
在本申请实施例中,目标模型中还包括有用于进行二次稠密化处理的参数以及计算购买概率的相关计算公式,示例性的,用于进行二次稠密化处理的参数包括第二用户矩阵P1、用户画像矩阵PR和第二物品矩阵Q1,将第二用户矩阵P1与用户向量pu相乘,得到更加稠密的最终用户向量p1u,将第二物品矩阵Q1与物品向量qi相乘得到更加稠密的最终物品向量q1i,将用户画像向量pru与用户画像矩阵PR相乘得到更加稠密的最终用户画像向量pr1u。当进行二次稠密化处理之后,目标模型可以根据计算购买概率的相关计算公式,以最终用户画像向量pr1u、最终物品向量q1i和最终用户向量p1u作为这些计算公式的输入,最终计算得到购买概率。
示例性的,可以先将最终用户画像向量pr1u、最终物品向量q1i和最终用户向量p1u拼接为表示向量Xu(A),然后以表示向量Xu(A)作为输入,通过计算公式计算得到购买概率。
示例性的,计算购买概率的计算公式可以如下:
Figure BDA0002803155260000121
Figure BDA0002803155260000122
Figure BDA0002803155260000131
上式中,W1x,b1x和a1x分别表示第x层的权重矩阵,偏置向量以及激活函数,W1o,b1o为输出层权重和偏置,σ(·)为sigmoid函数,p(x)为目标模型的输出,表示用户购买目标商品的概率。
应当说明的是,上式中涉及到的Wx、bx、Wo、bo、W1x、b1x、W1o和b1o等都为目标模型中的参数,这些参数的取值在训练优化后都为固定的最优值。
S404、根据用户与商品的购买概率,推荐商品信息至用户。
示例性的,不同的用户与不同的商品之间存在有相应的购买概率,例如用户A与商品B的购买概率为20%,与商品C的购买概率为80%,此时可以推荐商品C的信息给用户A。
示例性的,商品C的信息可以是商品C的促销信息、商品C的发布信息和商品C的存量信息等等,例如具体可以是该商品C在某日某个时间段将享有折扣或者降价等等。
本申请实施例通过输入用户信息和商品信息至已经训练好的目标模型,由训练好的目标模型对用户信息和商品信息进行处理得到用户与商品的购买概率,能够更有效的利用用户画像数据、用户历史行为数据预测用户购买商品的概率,从而准确的将筛选出用户所需要的商品,方便平台在后续能够将对应的商品信息推荐给用户。
在上述实施例的基础上,图5为本申请实施例提供的信息推荐方法实施例二的流程示意图,如图5所示,上述步骤S402具体可以通过如下步骤实现:
S501、对用户信息和商品信息进行独热编码,得到初始用户向量和初始物品向量。
示例性的,用户信息可以包括有用户的性别,当用户为男性时,通过独热编码可以得到初始用户向量为“1”,当用户为女性时,通过独热编码可以得到初始用户向量为“0”。
示例性的,商品信息包括有用户购买的商品ID和用户浏览的商品ID等等,通过独热编码同样可以得到初始物品向量。
S502、根据目标模型的第一用户矩阵和第一物品矩阵对初始用户向量、初始物品向量进行稠密化处理,得到用户向量和物品向量。
在本申请实施例中,目标模型中的第一用户矩阵P和第一物品矩阵Q的取值是通过不断对预设初始模型进行训练优化得到的最优值。
示例性的,稠密化处理可以是将初始用户向量
Figure BDA0002803155260000141
与倒置后的第一用户矩阵P相乘得到用户向量
Figure BDA0002803155260000142
将初始物品向量
Figure BDA0002803155260000143
与倒置后的第一物品矩阵Q相乘得到物品向量
Figure BDA0002803155260000144
本申请实施例通过对用户信息和商品信息进行独热编码,并根据目标模型中的第一用户矩阵和第一物品矩阵实现了用户信息与商品信息之间的拟合,更加有效了利用了用户与每一个商品之间的关联,提高后续用户与商品之间购买概率计算的精确度。
在上述实施例的基础上,图6为本申请实施例提供的信息推荐方法实施例三的流程示意图,如图6所示,上述步骤S403具体可以通过如下步骤实现:
S601、根据目标模型的第二用户矩阵、第二物品矩阵和第一用户画像矩阵,对用户画像向量、用户向量和物品向量进行二次稠密化处理,得到最终用户向量、最终用户画像向量、目标商品向量和最终物品向量。
在本申请实施例中,目标模型的第二用户矩阵P1、第一用户画像矩阵PR和第二物品矩阵Q1的取值是通过不断对预设初始模型进行训练优化得到的最优值。
示例性的,将第二用户矩阵P1倒置后与用户向量pu相乘得到二次稠密化处理之后的最终用户向量
Figure BDA0002803155260000145
将第二物品矩阵Q1倒置后与物品向量qi相乘得到二次稠密化处理之后的最终物品向量
Figure BDA0002803155260000146
将第一用户画像矩阵PR倒置后与用户画像向量pru相乘得到二次稠密化处理之后的最终用户画像向量pr1u=PR Tpru
S602、根据最终用户向量、最终用户画像向量、目标商品向量和最终物品向量,通过目标模型计算得到用户与商品的购买概率。
在本申请实施例中,目标商品向量
Figure BDA0002803155260000147
qA为初始目标商品向量,具体可以对商品信息中的目标商品进行独热编码,并通过一次稠密化处理得到,其中,目标商品为商家想要推送给用户的商品。
示例性的,可以对最终物品向量q1i进行加权求和,得到历史行为列表中商品向量qu(A),然后将最终用户向量p1u、最终用户画像向量pr1u、加权求和后的历史行为列表中商品向量qu(A),目标商品向量q1A进行拼接,得到实例整体的表示向量Xu(A),根据计算公式以及表示向量Xu(A),计算得到购买概率。
示例性的,对最终物品向量q1i进行加权求和,得到历史行为列表中商品向量qu(A)具体可以通过如下公式计算得到:
Figure BDA0002803155260000151
上式中,
Figure BDA0002803155260000152
为用户u的长度为H的历史行为商品的向量列表,q1A为目标商品向量,a(·)为输出各历史行为列表中商品权重wj的前馈网络,同时通过softmax函数对权重进行归一化使其满足约束
Figure BDA0002803155260000153
示例性的,可以将表示向量Xu(A)通过两层神经网络进行运算得到购买概率:
Figure BDA0002803155260000154
Figure BDA0002803155260000155
Figure BDA0002803155260000156
上式中,W1x,b1x和a1x分别表示第x层的权重矩阵,偏置向量以及激活函数,W1o,b1o为输出层权重和偏置,σ(·)为sigmoid函数,p(x)为模型输出,表示用户购买目标商品的概率,示例性的,激活函数选择PReLU函数。
本申请实施例通过对用户画像向量、用户向量和物品向量进行二次稠密化处理,能够使得用户画像向量、用户向量和物品向量更加的稠密,提高后续计算用户购买目标商品的概率的准确性。
在上述实施例的基础上,图7为本申请实施例提供的信息推荐方法实施例四的流程示意图,如图7所示,上述步骤S602具体可以通过如下步骤实现:
S701、根据目标模型对最终物品向量进行加权求和,得到最终历史行为向量。
在本申请实施例中,最终历史行为向量即上述的历史行为列表中商品向量qu(A),对最终物品向量q1i进行加权求和可以参考上述的公式。
S702、对目标商品向量、最终历史行为向量、最终用户向量和最终用户画像向量进行拼接,得到拼接后的向量。
在本申请实施例中,目标模型可以通过相应的算法对目标商品向量q1A、最终历史行为向量qu(A)、最终用户向量p1u、最终用户画像向量pr1u进行拼接。
示例性的,若目标商品向量q1A为“010”,最终历史行为向量qu(A)为“1111”,最终用户向量p1u为“101”,最终用户画像向量pr1u为“001”,则拼接后的向量为“0101111101001”。
S703、通过目标模型对拼接后的向量进行计算,得到用户与商品的购买概率。
在本申请实施例中,拼接后的向量即为上述的表示向量Xu(A),并可通过上述的公式计算得到用户与商品的购买概率p(x),在此不做赘述。
本申请实施例通过对最终物品向量进行加权求和,得到最终历史行为向量,能够充分利用每一个商品与用户之间的交互信息,增强每一个商品与对应的用户之间的关联性,提高后续计算购买概率的准确性。
在上述实施例的基础上,图8为本申请实施例提供的信息推荐方法实施例五的流程示意图,如图8所示,上述步骤S404具体可以通过如下步骤实现:
S801、获取不同的用户与同一商品的第一购买概率。
S802、根据第一购买概率对不同的用户进行排序得到用户排序。
S803、将同一商品的信息分别推荐至用户排序中相应的用户。
本申请实施例中,对于同一件商品来说,不同的用户的购买概率可以是不相同的,即第一购买概率可能有高有低,这样通过第一购买概率的高低从而可以对不同的用户进行排序,然后将该商品的信息推荐给序列中的用户。
示例性的,可以将商品的信息推荐给序列中前十的用户,或者设置购买概率阈值,将低于购买概率阈值的第一购买概率对应的用户筛除,不推荐商品的信息给这些被筛除的用户。
本申请实施例通过第一购买概率对用户进行排序,能够实现商品的信息的准确推荐,提高推荐效率。
在上述实施例的基础上,图9为本申请实施例提供的信息推荐方法实施例六的流程示意图,如图9所示,上述步骤S404具体可以通过如下步骤实现:
S901、获取各个不同的用户与不同商品的第二购买概率。
S902、根据第二购买概率,对不同商品进行排序,得到商品排序。
S903、将商品排序中相应的商品的信息分别推荐至各个不同的用户。
在本申请实施例中,在需要推荐若干个商品给同一个用户时,可以获取该用户与不同商品之间的第二购买概率,即第二购买概率是每一个商品与同一个用户之间的购买概率,通过对若干个第二购买概率高低进行排序,得到商品序列,然后将购买概率较高的商品推荐给用户。
本申请实施例通过确定不同用户及其与若干个商品之间的第二购买概率,可以将第二购买概率高的商品的信息推荐给对应的用户,从而实现对全体用户推荐不用的商品的信息,提高推荐效率
图10为本申请实施例提供的模型训练方法实施例一的流程示意图,如图10所示,该方法用于对预设初始模型进行训练优化,将预设初始模型中的参数的取值不断优化得到最优值,使得预设初始模型完成训练得到最后能够使用的目标模型,本实施例的方法执行主体可以是计算机等处理设备,该方法包括以下步骤:
S1001、构造训练样本。
其中,训练样本包括样本输入信息及其对应的样本标签,样本输入信息包括用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID。
在本申请实施例中,训练样本可以构造若干个,不同的训练样本包括有不同的样本输入信息及其对应的样本标签,例如不同的训练样本中具有不同的用户ID、不同的用户画像数据等等。历史行为列表为用户的历史行为操作所形成的列表,例如用户浏览N个商品,则历史行为列表的长度为N,其中包括有用户浏览的这N个商品的相关信息(例如商品的ID、价格等)。
示例性的,目标商品可以是需要进行推荐的商品,例如某一个商品正在或即将进行促销活动,该开展促销的商品就可以为目标商品。
示例性的,训练样本的形式可以为(x,y)的形式,其中,x表示样本输入信息,y表示对应的样本标签,y的取值可以为0或1,当取值为0时表示用户没有购买过目标商品,当取值为1时表示用户购买过目标商品。
S1002、通过预设初始模型对样本输入信息进行一次稠密化处理,获取用户向量和物品向量。
在本申请实施例中,预设初始模型中设置有各种各样的参数,示例性的,这些参数包括有第一用户矩阵、第一物品矩阵、第二用户矩阵和第二物品矩阵,预设初始模型中设置的参数的取值都不是最优值,需要对这些参数进行不断的迭代优化训练,最终得到的参数的取值才是最优值,即当参数的取值为最优值时,完成了对预设初始模型的训练,形成了可以使用的目标模型。
示例性的,当样本输入信息输入到预设初始模型之后,将对样本输入信息进行独热编码,得到初始用户向量
Figure BDA0002803155260000181
和初始物品向量
Figure BDA0002803155260000182
然后通过第一用户矩阵P和第一物品矩阵Q对样本输入信息进行稠密化处理。
示例性的,用户向量
Figure BDA0002803155260000183
物品向量
Figure BDA0002803155260000184
S1003、根据用户向量和物品向量,获取用户对历史行为列表中商品有历史交互行为的第一概率。
在本申请实施例中,预设初始模型中还包括有计算第一概率的计算公式以及计算公式所需要使用的一些参数,这些参数的取值可能不是最优值,需要通过对预设初始模型进行不断的迭代训练,最后得到目标模型时这些参数的取值才是最优值。
示例性的,第一概率的计算公式如下:
Figure BDA0002803155260000185
Figure BDA0002803155260000186
……
Figure BDA0002803155260000187
Figure BDA0002803155260000188
上式中,WL,bL和aL(·)分别表示第L层的权重矩阵,偏置向量以及激活函数,Wo,bo为输出层权重与偏置,σ(·)为sigmoid函数,最终输出
Figure BDA0002803155260000189
即为预测的用户u与物品i产生交互的第一概率。示例性的,激活函数可以选择tanh函数,ReLU函数等。
S1004、通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率。
其中,用户画像向量通过对用户画像数据进行独热编码得到,
在本申请实施例中,用户购买目标商品的第二概率可以为p(x),通过预设初始模型中的相关参数以及计算公式可以计算得到第二概率p(x)。
示例性的,第二概率p(x)的计算过程如下:
Figure BDA00028031552600001810
Figure BDA00028031552600001811
Figure BDA0002803155260000191
上式中,W1x,b1x和a1x分别表示第x层的权重矩阵,偏置向量以及激活函数。W1o,b1o为输出层权重和偏置,σ(·)为sigmoid函数。示例性的,激活函数可以选择PReLU函数。Xu(A)通过由最终用户向量
Figure BDA0002803155260000192
最终用户画像向量pr1u=PR Tpru、最终历史行为向量
Figure BDA0002803155260000193
以及目标商品向量
Figure BDA0002803155260000194
拼接得到,其中,用户向量
Figure BDA0002803155260000195
物品向量
Figure BDA0002803155260000196
用户画像向量pru,第二用户矩阵P1,用户画像矩阵PR,第二物品矩阵Q1,第一目标商品向量qA
S1005、根据第一损失和第二损失得到目标损失,通过目标损失对预设初始模型进行训练优化得到目标模型。
其中,第一损失为预设初始模型根据第一概率计算得到,第二损失为预设初始模型根据第二概率计算得到。
示例性的,预设初始模型可以通过第一损失函数计算得到第一损失
Figure BDA0002803155260000197
第一损失函数具体如下:
Figure BDA0002803155260000198
上式中,(u,i)∈γ∪γ-,u为用户u,i为物品i,γ为正样本数据集,γ-为负样本数据集。
示例性的,预设初始模型可以通过第二损失函数计算得到第二损失
Figure BDA0002803155260000199
第二损失函数具体如下:
Figure BDA00028031552600001910
其中,xu为输入数据,yu∈{0,1}为样本标签,p(xu)为输出的第二概率。
示例性的,预设初始模型可以通过目标损失计算函数获取目标损失,目标损失函数具体如下:
Figure BDA00028031552600001911
Figure BDA00028031552600001912
其中,λ为正则化系数(可以通过经验值或者由网格搜索法确定),D为用户u的历史行为列表中商品集合,αi代表用户u与其历史行为列表中商品i所对应的第一损失
Figure BDA00028031552600001913
的权重,通过计算商品i的物品向量qi与第一目标商品向量qA的相似性得出。
示例性的,本申请实施例可以采用小批量随机梯度下降法(MBGD)进行模型训练,将训练集分为多个batch,针对每个batch中的训练样本(xu,yu)计算得到目标损失Lu
Figure BDA0002803155260000201
对每个batch中样本损失进行加和得到整体损失:
Figure BDA0002803155260000202
并通过梯度反向传播,对模型参数进行不断优化。
示例性的,可以通过目标损失得到梯度信息,使用随机梯度下降法对预设初始模型进行训练,得到预设初始模型中的参数P、Q、Wx、bx、Wo、bo、P1、Q1、W1x、b1x、W1o、b1o等的最优取值,使得预设初始模型通过训练优化后变为可以使用的目标模型供上述信息推荐方法使用。
本申请实施例中,通过对用户和历史行为序列中物品的交互进行拟合,得到稠密的用户向量和物品向量,并且通过级联的方式将得到的用户向量和物品向量作为预设初始模型的第二部分(即预设初始模型的深度兴趣网络)的输入,弥补了传统的深度兴趣网络中将用户历史行为列表中所有商品进行加权求和后得到的向量与用户向量进行运算导致用户和每一个历史行为商品之间交互信息丢失的不足,从而有效的对预设初始模型进行优化,使优化后的目标模型能够更能有效利用用户和历史行为列表中每个商品之间的关联,提高购买概率预测的准确性。
在NCF损失中使用不同权重的作用是,利用注意力机制,根据不同商品与目标商品之间的相关性衡量其重要性,进而让模型能够更加倾向于从重要的商品中获取更多信息
在上述实施例的基础上,图11为本申请实施例提供的模型训练方法实施例二的流程示意图,如图11所示,若训练样本包括正样本和负样本,则步骤S1001具体可以通过如下步骤实现:
S1101、获取用户ID和用户画像数据。
S1102、当用户有商品购买记录时,根据用户的商品购买记录获取历史行为列表中商品ID列表和目标商品ID。
S1103、根据用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造正样本和负样本。
在本申请实施例中,训练样本的形式可以为(x,y),其中,x由(用户ID,用户画像数据,长度为N的历史行为列表中商品ID列表,目标商品ID)组成,标签y为是否购买目标商品(购买为1,未购买为0)。
示例性的,对于有商品购买记录的用户,可以截取购买时间点t之前连续N个历史行为商品构成x中的历史行为商品列表D,该时间点所购买的商品Candi1为x中的目标商品。
截取购买时间点t之前连续N个历史行为商品构成x中的历史行为商品列表D,随机选取该时间点未购买商品Candi0为x中的目标商品,NCF部分标签yNCF=1,模型最终标签y=0,构造负样本。
S1104、当用户没有商品购买记录时,根据用户的商品浏览记录获取历史行为列表中商品ID列表和目标商品ID。
S1105、根据用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造负样本。
在本申请实施例中,当用户没有商品购买记录时,则可以选取时间点t之前连续N个历史行为商品构成x中的历史行为商品列表D,任意选取商品Candi0为x中的目标商品,NCF部分标签yNCF=1,模型最终标签y=0,构造负样本。
本申请实施例通过分别对有购买记录的用户和没有购买记录的用户建立对应的训练样本,能够避免由于用户无历史购买信息所造成的冷启动问题,提高后续目标模型的预测准确性。
在上述实施例的基础上,图12为本申请实施例提供的模型训练方法实施例三的流程示意图,如图12所示,上述步骤S1002可以通过如下步骤实现:
S1201、对样本输入信息进行独热编码,得到初始用户向量和初始物品向量。
S1202、根据预设初始模型的第一用户矩阵和第一物品矩阵对初始用户向量和初始物品向量进行一次稠密化处理,得到用户向量和物品向量。
在本申请实施例中,独热编码又称为ONE-HOT编码,示例性的,样本输入信息包括有用户ID和商品ID,通过对用户ID进行独热编码可以得到初始用户向量
Figure BDA0002803155260000221
通过对商品ID进行独热编码可以得到初始物品向量
Figure BDA0002803155260000222
在本申请实施例中,预设初始模型的第一用户矩阵P和第一物品矩阵的取值Q并非是最优值,当对预设初始模型进行不断训练优化,完成训练优化之后得到的目标模型的第一用户矩阵和第一物品矩阵的取值为最优值。
示例性的,用户向量
Figure BDA0002803155260000223
物品向量
Figure BDA0002803155260000224
本申请实施例通过对用户和历史行为序列中物品的交互进行拟合,得到稠密的用户向量和物品向量,能够弥补后续模型第二部分(深度兴趣网络)中将用户历史行为列表中所有商品进行加权求和后得到的向量与用户向量进行运算导致用户和每一个历史行为商品之间交互信息丢失的不足,从而使优化后的目标模型更能有效利用用户和历史行为列表中每个商品之间的关联,提高购买概率预测的准确性。
在上述实施例的基础上,图13为本申请实施例提供的模型训练方法实施例四的流程示意图,如图13所示,该方法还可以包括步骤:
S1301、获取用户无历史行为列表中商品列表。
在本申请实施例中,用户针对网上购物平台上的各种商品,有的商品用户会有历史行为,有的商品没有历史行为,通过截取一段时间内用户没有历史行为的商品,构成用户无历史行为列表中商品列表。
示例性的,可以构造时间点t之前用户无历史行为的商品列表
Figure BDA0002803155260000225
然后输入至预设初始模型中。
S1302、获取用户对无历史行为列表中商品的历史交互行为概率。
在本申请实施例中,无历史行为列表中商品列表包括有商品ID,示例性的,预设初始模型可以通过用户ID和无历史行为列表中商品列表中的商品ID,得到用户向量和物品向量,并根据用户向量和物品向量计算得到用户对无历史行为列表中商品的历史交互行为概率。
S1303、根据无历史行为列表中商品的历史交互行为概率计算第三损失。
在本申请实施例中,预设初始模型可以通过损失函数计算第三损失,示例性的,损失函数可以采用上述计算第一损失所使用的第一损失函数,在此不做赘述。
S1304、根据第三损失对预设初始模型的网络参数进行更新。
其中,网络参数至少包括预设初始模型的第一用户矩阵和第一物品矩阵。示例性的,对第三损失梯度进行反向传播以对预设初始模型的网络参数进行更新,通过对网络参数的更新可以实现该网络参数的进一步优化,以趋近于最优值。
示例性的,网络参数还可以包括上述的第x层的权重矩阵Wx,第x层的偏置向量bx和第x层的激活函数ax(·),输出层权重Wo,输出层偏置向量bo等。
本申请实施例通过对无历史行为列表中商品的历史交互行为概率进行计算,并获取第三损失来对预设初始模型中的第一部分(神经协同过滤)的网络参数进行优化,能够避免由于用户无历史购买信息所造成的的冷启动问题,提高后续目标模型的购买概率预测准确性。
在上述实施例的基础上,图14为本申请实施例提供的模型训练方法实施例五的流程示意图,如图14所示,上述步骤S1302可以通过如下步骤实现:
S1401、根据用户ID、用户画像数据、无历史行为列表中商品列表和目标商品,构造训练负样本。
其中,训练负样本包括负样本输入信息及负样本输入信息对应的样本标签。
示例性的,训练负样本的形式可以为
Figure BDA0002803155260000231
Figure BDA0002803155260000232
为负样本输入信息,
Figure BDA0002803155260000233
为对应的样本标签。
对于有购买记录的用户,具体可以构造购买时间点t之前用户无历史行为的商品列表
Figure BDA0002803155260000234
用户ID及列表
Figure BDA0002803155260000235
中每个商品ID构成
Figure BDA0002803155260000236
对应的标签
Figure BDA0002803155260000237
作为训练负样本。
对于没有购买记录的用户,具体可以构造时间点t之前用户无历史行为的商品列表
Figure BDA0002803155260000238
用户ID及列表
Figure BDA0002803155260000239
中每个商品ID构成
Figure BDA00028031552600002310
对应标签
Figure BDA00028031552600002311
作为NCF部分的负样本。
S1402、通过预设初始模型对负样本输入信息进行一次稠密化处理,获取第三用户向量和第三物品向量。
在本申请实施例中,可以预设初始模型可以通过第一用户矩阵P和第一物品矩阵Q来对负样本输入信息进行稠密化,得到第三用户向量和第三物品向量。
示例性的,将负样本输入信息进行独热编码之后,分别与倒置后的第一用户矩阵P和倒置后的第一物品矩阵Q相乘,得到第三用户向量和第三物品向量。
S1403、根据第三用户向量和第三物品向量,计算用户对无历史行为列表中商品的历史交互行为概率。
示例性的,可以采用上述计算第一概率的计算公式计算得到用户对无历史行为列表中商品的历史交互行为概率。
本申请实施例通过构造训练负样本,以及进行一次稠密化处理来计算得到用户对无历史行为列表中商品的历史交互行为概率,能够提高用户对无历史行为列表中商品的历史交互行为概率的计算准确度,方便后续对预设初始模型中的第一部分(神经协同过滤)的网络参数进行优化。
在上述实施例的基础上,图15为本申请实施例提供的模型训练方法实施例六的流程示意图,如图15所示,上述步骤S1004可以通过如下步骤实现:
S1501、根据预设初始模型的第二用户矩阵、第二物品矩阵和用户画像矩阵,对用户向量、物品向量和用户画像向量进行二次稠密化处理,得到最终用户向量、最终物品向量、目标商品向量和最终用户画像向量。
示例性的,最终用户向量
Figure BDA0002803155260000241
最终用户画像向量pr1u=PR Tpru,最终物品向量
Figure BDA0002803155260000242
以及目标商品向量
Figure BDA0002803155260000243
其中,第二用户矩阵P1,用户向量pu,第一用户画像矩阵PR,用户画像向量pru,物品向量qi,第二物品矩阵Q1,第一目标商品向量qA
S1502、根据最终用户向量、最终用户画像向量、最终商品向量和目标商品向量,计算得到用户购买目标商品的第二概率。
在本申请实施例中,用户购买目标商品的第二概率可以通过上述信息推荐方法中计算购买概率的方式计算得到,具体在此不做赘述。
本申请实施例通过对用户画像向量、用户向量和物品向量进行二次稠密化处理,能够使得用户画像向量、用户向量和物品向量更加的稠密,方便后续对预设初始模型进行训练优化。
在上述实施例的基础上,图16为本申请实施例提供的模型训练方法实施例七的流程示意图,如图16所示,上述步骤S1502可以通过如下步骤实现:
S1601、对最终物品向量进行加权求和,获取最终历史行为向量。
示例性的,对最终物品向量q1i进行加权求和,得到最终历史行为向量qu(A)具体可以通过如下公式计算得到:
Figure BDA0002803155260000251
上式中,
Figure BDA0002803155260000252
为用户u的长度为H的历史行为商品的向量列表,q1A为目标商品向量,a(·)为输出各历史行为列表中商品权重wj的前馈网络,同时通过softmax函数对权重进行归一化使其满足约束
Figure BDA0002803155260000253
S1602、根据最终用户向量、最终用户画像向量、最终历史行为向量和目标商品向量,计算得到用户购买目标商品的第二概率。
在本申请实施例中,用户购买目标商品的第二概率可以通过上述信息推荐方法中计算购买概率的方式计算得到,具体在此不做赘述。
本申请实施例通过对最终物品向量进行加权求和,得到最终历史行为向量,能够充分利用每一个商品与用户之间的交互信息,增强每一个商品与对应的用户之间的关联性,提高后续对预设初始模型进行训练优化的效果。
在上述实施例的基础上,图17为本申请实施例提供的模型训练方法实施例八的流程示意图,如图17所示,上述步骤S1005可以通过如下步骤实现:
S1701、根据目标商品向量和物品向量,获取训练样本的第一损失的权重。
在本申请实施例中,第一损失的权重αi表示的是用户u与其历史行为列表中商品i所对应的第一损失
Figure BDA0002803155260000254
的权重。
示例性的,可以通过以下公式计算得到:
Figure BDA0002803155260000255
上式中,D为用户u的历史行为列表中商品集合,物品向量qi,第一目标商品向量qA
S1702、获取训练样本的第一损失对应的正则化系数,根据权重、正则化系数、第一损失和第二损失得到训练样本的目标损失。
在本申请实施例中,正则化系数λ可以通过经验值或者由网格搜索法确定。
示例性的,目标损失
Figure BDA0002803155260000256
S1703、对各个训练样本的目标损失进行求和得到总目标损失,根据总目标损失对预设初始模型进行训练优化得到目标模型。
在本申请实施例中,训练样本(xu,yu)的目标损失为Lu,每个batch中的训练样本的目标损失进行加和得到总目标损失Lbatch=∑u∈batchLu,通过梯度反向传播,对预设初始模型的参数进行不断优化,达到一定终止条件后停止训练(如损失阈值、迭代次数),得到最终的目标模型。
本申请实施例利用注意力机制的原理,在目标损失中加入优化过的第一损失作为正则化项,并给予用户历史行为列表中不同商品的第一损失不同的权重,可有效避免预设初始模型过拟合,并让预设初始模型从与目标商品相关性高的历史行为商品中获取更多信息,增强后续目标模型的购买概率预测的准确度。
综上,本申请实施例通过神经协同过滤(NCF,Neural Collaborative Filtering)构造用户向量和物品向量,然后再利用第一部分的用户向量和物品向量构造数据集,作为深度兴趣网络(又称为DIN,Deep Interest Network)的输入,进行用户与目标商品的购买概率的预测建模,这样就可以弥补DIN中将用户历史行为列表中所有商品进行加权求和后得到的向量与用户向量进行运算导致用户和每一个历史行为商品之间交互信息丢失的不足,并且也能够避免由于用户无历史购买记录所造成的冷启动问题。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图18为本申请实施例提供的信息推荐装置的结构示意图,如图18所示,该装置可以包括数据获取模块1801、数据输入模块1802、概率获取模块1803和推荐模块1804,其中,
数据获取模块1801用于获取用户信息、商品信息和用户画像向量。
数据输入模块1802用于根据目标模型对用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量,目标模型为通过对预设初始模型训练得到。
概率获取模块1803用于根据目标模型对用户画像向量、用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率。
推荐模块1804用于根据用户与商品的购买概率,推荐对应的商品的信息至对应的用户。
其中,用户信息包括用户画像数据和用户历史行为数据,商品信息包括商品ID,用户画像向量通过对用户画像数据进行独热编码得到。
示例性的,在上述实施例的基础上,本申请实施例中的数据输入模块1802具体可用于对用户信息和商品信息进行独热编码,得到初始用户向量和初始物品向量,以及根据目标模型的第一用户矩阵和第一物品矩阵对初始用户向量、初始物品向量进行稠密化处理,得到用户向量和物品向量。
示例性的,在上述实施例的基础上,本申请实施例中的概率获取模块1803具体还可以用于根据目标模型的第二用户矩阵、第二物品矩阵和第一用户画像矩阵,对用户画像向量、用户向量和物品向量进行二次稠密化处理,得到最终用户向量、最终用户画像向量、目标商品向量和最终物品向量,以及根据最终用户向量、最终用户画像向量、目标商品向量和最终物品向量,通过目标模型计算得到用户与商品的购买概率。
示例性的,在上述实施例的基础上,本申请实施例中的概率获取模块1803还可以用于根据目标模型对最终物品向量进行加权求和,得到最终历史行为向量,并对目标商品向量、最终历史行为向量、最终用户向量和最终用户画像向量进行拼接,得到拼接后的向量,以及通过目标模型对拼接后的向量进行计算,得到用户与商品的购买概率。
示例性的,在上述实施例的基础上,本申请实施例中的推荐模块1804还可以用于获取不同的用户与同一商品的第一购买概率,并根据第一购买概率对不同的用户进行排序得到用户排序,以及将同一商品的信息分别推荐至用户排序中相应的用户。
示例性的,在上述实施例的基础上,本申请实施例中的推荐模块1804也可以用于获取各个不同的用户与不同商品的第二购买概率,并根据第二购买概率,对不同商品进行排序,得到商品排序,以及将商品排序中相应的商品的信息分别推荐至各个不同的用户。
图19为本申请实施例提供的模型训练装置的结构示意图,如图19所示,该装置可以包括:样本构造模块1901、一次处理模块1902、第一概率获取模块1903、第二概率获取模块1904和训练模块1905,其中,
样本构造模块1901用于构造训练样本。
一次处理模块1902用于通过预设初始模型对样本输入信息进行一次稠密化处理,获取用户向量和物品向量。
第一概率获取模块1903用于根据用户向量和物品向量,获取用户对历史行为列表中商品有历史交互行为的第一概率。
第二概率获取模块1904用于通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率。
训练模块1905用于根据第一损失和第二损失得到目标损失,通过目标损失对预设初始模型进行训练优化得到目标模型。
其中,训练样本包括样本输入信息及其对应的样本标签,样本输入信息包括用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID;用户画像向量通过对用户画像数据进行独热编码得到;第一损失为预设初始模型根据第一概率计算得到,第二损失为预设初始模型根据第二概率计算得到。
在一个实施例中,样本构造模块1901可以具体用于获取用户ID和用户画像数据,当用户有商品购买记录时,根据用户的商品购买记录获取历史行为列表中商品ID列表和目标商品ID,并根据用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造正样本和负样本;当用户没有商品购买记录时,根据用户的商品浏览记录获取历史行为列表中商品ID列表和目标商品ID,并根据用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造负样本。
在一个实施例中,一次处理模块1902具体可以用于对样本输入信息进行独热编码,得到初始用户向量和初始物品向量,并根据预设初始模型的第一用户矩阵和第一物品矩阵对初始用户向量和初始物品向量进行一次稠密化处理,得到用户向量和物品向量。
在一个实施例中,一次处理模块1902具体可以用于获取用户无历史行为列表中商品列表,并获取用户对无历史行为列表中商品的历史交互行为概率,以及根据无历史行为列表中商品的历史交互行为概率计算第三损失,以及根据第三损失对预设初始模型的网络参数进行更新。
其中,网络参数至少包括预设初始模型的第一用户矩阵和第一物品矩阵。
在一个实施例中,一次处理模块1902还具体可以用于根据用户ID、用户画像数据、无历史行为列表中商品列表和目标商品,构造训练负样本,训练负样本包括负样本输入信息及负样本输入信息对应的样本标签,并通过预设初始模型对负样本输入信息进行一次稠密化处理,获取第三用户向量和第三物品向量,以及根据第三用户向量和第三物品向量,计算用户对无历史行为列表中商品的历史交互行为概率。
在一个实施例中,第二概率获取模块1904具体可以用于根据预设初始模型的第二用户矩阵、第二物品矩阵和用户画像矩阵,对用户向量、物品向量和用户画像向量进行二次稠密化处理,得到最终用户向量、最终物品向量、目标商品向量和最终用户画像向量,并根据最终用户向量、最终用户画像向量、最终物品向量和目标商品向量,计算得到用户购买目标商品的第二概率。
在一个实施例中,第二概率获取模块1904具体还可以用于对最终物品向量进行加权求和,获取最终历史行为向量,以及根据最终用户向量、最终用户画像向量、最终历史行为向量和目标商品向量,计算得到用户购买目标商品的第二概率。
在一个实施例中,训练模块1905具体可以用于根据目标商品向量和物品向量,获取训练样本的第一损失的权重,并获取训练样本的第一损失对应的正则化系数,根据权重、正则化系数、第一损失和第二损失得到训练样本的目标损失,以及对各个训练样本的目标损失进行求和得到总目标损失,根据总目标损失对预设初始模型进行训练优化得到目标模型。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
图20为本申请实施例提供的计算机设备的结构示意图,如图20所示,其包括存储器2001和至少一个处理器2002;
存储器2001存储计算机执行指令;
至少一个处理器2002执行存储器2001存储的计算机执行指令,使得至少一个处理器2002执行上述的方法。
可选的,存储器2001既可以是独立的,也可以跟处理器2002集成在一起,当存储器2001独立设置时,该显示设备还包括总线2003,用于连接存储器2001和处理器2002。
在一个实施例中,本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述的方法步骤。
本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系;在公式中,字符“/”,表示前后关联对象是一种“相除”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中,a,b,c可以是单个,也可以是多个。
可以理解的是,在本申请实施例中涉及的各种数字编号仅为描述方便进行的区分,并不用来限制本申请的实施例的范围。在本申请的实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (17)

1.一种信息推荐方法,其特征在于,包括:
获取用户信息、商品信息和用户画像向量,所述用户信息包括用户画像数据和用户历史行为数据,所述商品信息包括商品ID,所述用户画像向量为通过对所述用户画像数据进行独热编码得到;
根据目标模型对所述用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量,所述目标模型为通过对预设初始模型训练得到;
根据所述目标模型对所述用户画像向量、所述用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率;
根据所述用户与商品的购买概率,推荐所述商品信息至所述用户。
2.根据权利要求1所述的方法,其特征在于,所述根据目标模型对所述用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量,包括:
对所述用户信息和所述商品信息进行独热编码,得到初始用户向量和初始物品向量;
根据目标模型的第一用户矩阵和第一物品矩阵对所述初始用户向量、初始物品向量进行稠密化处理,得到用户向量和物品向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标模型对用户画像向量、所述用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率,包括:
根据目标模型的第二用户矩阵、第二物品矩阵和第一用户画像矩阵,对所述用户画像向量、用户向量和物品向量进行二次稠密化处理,得到最终用户向量、最终用户画像向量、目标商品向量和最终物品向量;
根据所述最终用户向量、最终用户画像向量、目标商品向量和最终物品向量,通过目标模型计算得到用户与商品的购买概率。
4.根据权利要求3所述的方法,其特征在于,所述根据所述最终用户向量、最终用户画像向量、目标商品向量和最终物品向量,通过目标模型计算得到用户与商品的购买概率,包括:
根据目标模型对所述最终物品向量进行加权求和,得到最终历史行为向量;
对目标商品向量、所述最终历史行为向量、最终用户向量和最终用户画像向量进行拼接,得到拼接后的向量;
通过所述目标模型对所述拼接后的向量进行计算,得到用户与商品的购买概率。
5.根据权利要求1所述的方法,其特征在于,所述根据所述用户与商品的购买概率,推荐所述商品信息至所述用户,包括:
获取不同的用户与同一商品的第一购买概率;
根据所述第一购买概率对不同的用户进行排序得到用户排序;
将所述同一商品的信息分别推荐至所述用户排序中相应的用户;或,
获取各个不同的用户与不同商品的第二购买概率;
根据所述第二购买概率,对所述不同商品进行排序,得到商品排序;
将所述商品排序中相应的商品的信息分别推荐至各个不同的用户。
6.一种模型训练方法,其特征在于,包括:
构造训练样本,所述训练样本包括样本输入信息及其对应的样本标签,所述样本输入信息包括用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID;
通过预设初始模型对所述样本输入信息进行一次稠密化处理,获取用户向量和物品向量;
根据所述用户向量和所述物品向量,获取用户对历史行为列表中商品有历史交互行为的第一概率;
通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率,所述用户画像向量通过对所述用户画像数据进行独热编码得到;
根据所述第一损失和第二损失得到目标损失,通过所述目标损失对所述预设初始模型进行训练优化得到目标模型,所述第一损失为预设初始模型根据所述第一概率计算得到,所述第二损失为预设初始模型根据所述第二概率计算得到。
7.根据权利要求6所述的方法,其特征在于,所述训练样本包括正样本和负样本,所述构造训练样本,包括:
获取用户ID和用户画像数据;
当用户有商品购买记录时,根据用户的商品购买记录获取历史行为列表中商品ID列表和目标商品ID;
根据所述用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造正样本和负样本;
当用户没有商品购买记录时,根据用户的商品浏览记录获取历史行为列表中商品ID列表和目标商品ID;
根据所述用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID构造负样本。
8.根据权利要求6所述的方法,其特征在于,所述通过预设初始模型对所述样本输入信息进行一次稠密化处理,获取用户向量和物品向量,包括:
对所述样本输入信息进行独热编码,得到初始用户向量和初始物品向量;
根据预设初始模型的第一用户矩阵和第一物品矩阵对所述初始用户向量和初始物品向量进行一次稠密化处理,得到用户向量和物品向量。
9.根据权利要求8所述的方法,其特征在于,还包括:
获取用户无历史行为列表中商品列表;
获取用户对无历史行为列表中商品的历史交互行为概率;
根据所述无历史行为列表中商品的历史交互行为概率计算第三损失;
根据所述第三损失对所述预设初始模型的网络参数进行更新,所述网络参数至少包括预设初始模型的第一用户矩阵和第一物品矩阵。
10.根据权利要求9所述的方法,其特征在于,所述获取用户对无历史行为列表中商品的历史交互行为概率,包括:
根据用户ID、用户画像数据、无历史行为列表中商品列表和目标商品,构造训练负样本,所述训练负样本包括负样本输入信息及所述负样本输入信息对应的样本标签;
通过预设初始模型对所述负样本输入信息进行一次稠密化处理,获取第三用户向量和第三物品向量;
根据所述第三用户向量和所述第三物品向量,计算用户对无历史行为列表中商品的历史交互行为概率。
11.根据权利要求6所述的方法,其特征在于,所述通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率,包括:
根据预设初始模型的第二用户矩阵、第二物品矩阵和用户画像矩阵,对所述用户向量、物品向量和用户画像向量进行二次稠密化处理,得到最终用户向量、最终物品向量、目标商品向量和最终用户画像向量;
根据所述最终用户向量、最终用户画像向量、所述最终物品向量和所述目标商品向量,计算得到用户购买目标商品的第二概率。
12.根据权利要求11所述的方法,其特征在于,所述根据所述最终用户向量、最终用户画像向量、所述最终物品向量和所述目标商品向量,计算得到用户购买目标商品的第二概率,包括:
对所述最终物品向量进行加权求和,获取最终历史行为向量;
根据所述最终用户向量、最终用户画像向量、最终历史行为向量和所述目标商品向量,计算得到用户购买目标商品的第二概率。
13.根据权利要求12所述的方法,其特征在于,所述根据所述第一损失和第二损失得到目标损失,通过所述目标损失对所述预设初始模型进行训练优化得到目标模型,包括:
根据目标商品向量和物品向量,获取训练样本的第一损失的权重;
获取所述训练样本的第一损失对应的正则化系数,根据所述权重、正则化系数、第一损失和第二损失得到所述训练样本的目标损失;
对各个训练样本的目标损失进行求和得到总目标损失,根据所述总目标损失对所述预设初始模型进行训练优化得到目标模型。
14.一种信息推荐装置,其特征在于,包括:
数据获取模块,用于获取用户信息、商品信息和用户画像向量,所述用户信息包括用户画像数据和用户历史行为数据,所述商品信息包括商品ID,所述用户画像向量为通过对所述用户画像数据进行独热编码得到;
数据输入模块,用于根据目标模型对所述用户信息和商品信息进行一次稠密化处理,得到用户向量和物品向量,所述目标模型为通过对预设初始模型训练得到;
概率获取模块,用于根据所述目标模型对用户画像向量、所述用户向量和物品向量进行二次稠密化处理,得到用户与商品的购买概率,所述用户画像向量通过对用户画像数据进行独热编码得到;
推荐模块,用于根据所述用户与商品的购买概率,推荐所述商品信息至所述用户。
15.一种模型训练装置,其特征在于,包括:
样本构造模块,用于构造训练样本,所述训练样本包括样本输入信息及其对应的样本标签,所述样本输入信息包括用户ID、用户画像数据、历史行为列表中商品ID列表和目标商品ID;
一次处理模块,用于通过预设初始模型对所述样本输入信息进行一次稠密化处理,获取用户向量和物品向量;
第一概率获取模块,用于根据所述用户向量和所述物品向量,获取用户对历史行为列表中商品有历史交互行为的第一概率;
第二概率获取模块,用于通过预设初始模型对用户向量、物品向量和用户画像向量进行二次稠密化处理,获取用户购买目标商品的第二概率,所述用户画像向量通过对所述用户画像数据进行独热编码得到;
训练模块,用于根据所述第一损失和第二损失得到目标损失,通过所述目标损失对所述预设初始模型进行训练优化得到目标模型,所述第一损失为预设初始模型根据所述第一概率计算得到,所述第二损失为预设初始模型根据所述第二概率计算得到。
16.一种计算机设备,其特征在于,包括存储器和至少一个处理器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-13任一项所述的方法。
17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机可读存储介质中存储有计算机指令,当其在计算机上运行时,使得计算机执行如权利要求1-13任一项所述的方法。
CN202011357912.6A 2020-11-27 2020-11-27 信息推荐方法、装置和模型训练方法、装置 Active CN113763095B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011357912.6A CN113763095B (zh) 2020-11-27 2020-11-27 信息推荐方法、装置和模型训练方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011357912.6A CN113763095B (zh) 2020-11-27 2020-11-27 信息推荐方法、装置和模型训练方法、装置

Publications (2)

Publication Number Publication Date
CN113763095A true CN113763095A (zh) 2021-12-07
CN113763095B CN113763095B (zh) 2023-09-26

Family

ID=78786095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011357912.6A Active CN113763095B (zh) 2020-11-27 2020-11-27 信息推荐方法、装置和模型训练方法、装置

Country Status (1)

Country Link
CN (1) CN113763095B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860870A (zh) * 2022-12-16 2023-03-28 深圳市云积分科技有限公司 一种商品推荐方法、系统、装置及可读介质
CN116245619A (zh) * 2023-05-12 2023-06-09 广州市玄武无线科技股份有限公司 商品向量嵌入方法、商品相似度评估方法及商品陈列方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920147A (zh) * 2017-02-28 2017-07-04 华中科技大学 一种基于词向量数据驱动的商品智能推荐方法
WO2019223379A1 (zh) * 2018-05-22 2019-11-28 阿里巴巴集团控股有限公司 一种产品推荐方法和装置
CN110648163A (zh) * 2019-08-08 2020-01-03 中山大学 一种基于用户评论的推荐算法
CN111310056A (zh) * 2020-03-11 2020-06-19 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、设备及存储介质
CN111597428A (zh) * 2019-02-20 2020-08-28 中国科学院声学研究所 一种具有q分离k稀疏的用户与物品拼接的推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106920147A (zh) * 2017-02-28 2017-07-04 华中科技大学 一种基于词向量数据驱动的商品智能推荐方法
WO2019223379A1 (zh) * 2018-05-22 2019-11-28 阿里巴巴集团控股有限公司 一种产品推荐方法和装置
CN111597428A (zh) * 2019-02-20 2020-08-28 中国科学院声学研究所 一种具有q分离k稀疏的用户与物品拼接的推荐方法
CN110648163A (zh) * 2019-08-08 2020-01-03 中山大学 一种基于用户评论的推荐算法
CN111310056A (zh) * 2020-03-11 2020-06-19 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、设备及存储介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
FARHAN UIIAH等: "Deep Edu: A Deep Neural Collaborative Filtering for Educaional Services Recommedation", 《IEEE》, vol. 8, pages 110915 - 110928 *
YUANBO XU等: "Improving Recommendations by Embedding Multi-Entity Relationships With Latent Dual-Metric Learning", 《IEEE》, vol. 7, pages 9817 - 9826, XP011707177, DOI: 10.1109/ACCESS.2018.2890480 *
吴敏: "深度学习框架下充电桩的个性化推荐算法研究", 中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》, no. 08, pages 034 - 207 *
张燕红: "面向稀疏矩阵偏置的协同过滤推荐算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》, no. 02, pages 138 - 2893 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860870A (zh) * 2022-12-16 2023-03-28 深圳市云积分科技有限公司 一种商品推荐方法、系统、装置及可读介质
CN116245619A (zh) * 2023-05-12 2023-06-09 广州市玄武无线科技股份有限公司 商品向量嵌入方法、商品相似度评估方法及商品陈列方法
CN116245619B (zh) * 2023-05-12 2023-08-15 广州市玄武无线科技股份有限公司 商品向量嵌入方法、商品相似度评估方法及商品陈列方法

Also Published As

Publication number Publication date
CN113763095B (zh) 2023-09-26

Similar Documents

Publication Publication Date Title
Wang et al. Attention-based transactional context embedding for next-item recommendation
CN112182412B (zh) 用于推荐体检项目的方法、计算设备和计算机存储介质
CN110956497B (zh) 一种电子商务平台用户重复购买行为预测方法
Bose et al. Quantitative models for direct marketing: A review from systems perspective
CN111461841B (zh) 物品推荐方法、装置、服务器及存储介质
CN112131480B (zh) 基于多层异质属性网络表征学习的个性化商品推荐方法及系统
CN108665311B (zh) 一种基于深度神经网络的电商用户时变特征相似性计算推荐方法
CN109034960B (zh) 一种基于用户节点嵌入的多属性推断的方法
CN111709810A (zh) 基于推荐模型的对象推荐方法及装置
CN112085615A (zh) 图神经网络的训练方法及装置
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及系统
CN113763095A (zh) 信息推荐方法、装置和模型训练方法、装置
Le et al. A multi-criteria collaborative filtering approach using deep learning and dempster-shafer theory for hotel recommendations
CN114861050A (zh) 一种基于神经网络的特征融合推荐方法及系统
CN115860880A (zh) 基于多层异质图卷积模型的个性化商品推荐方法及系统
CN111429161A (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN113850654A (zh) 物品推荐模型的训练方法、物品筛选方法、装置和设备
CN113780479A (zh) 周期预测模型的训练方法及装置、周期预测方法、设备
CN116340643B (zh) 对象推荐的调整方法及装置、存储介质、电子设备
CN116977019A (zh) 一种商户推荐方法、装置、电子设备及存储介质
Zheng et al. Incorporating price into recommendation with graph convolutional networks
CN111340566A (zh) 一种商品分类方法、装置、电子设备及存储介质
CN116204723A (zh) 一种基于动态超图表示学习的社交推荐方法
CN113837843B (zh) 产品推荐方法、装置、介质及电子设备
Wang et al. Jointly modeling intra-and inter-transaction dependencies with hierarchical attentive transaction embeddings for next-item recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant