CN111815410A - 基于选择性邻域信息的商品推荐方法 - Google Patents

基于选择性邻域信息的商品推荐方法 Download PDF

Info

Publication number
CN111815410A
CN111815410A CN202010644877.XA CN202010644877A CN111815410A CN 111815410 A CN111815410 A CN 111815410A CN 202010644877 A CN202010644877 A CN 202010644877A CN 111815410 A CN111815410 A CN 111815410A
Authority
CN
China
Prior art keywords
neighborhood
target user
information
neighborhood information
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010644877.XA
Other languages
English (en)
Other versions
CN111815410B (zh
Inventor
温家辉
张光达
王会权
王冬升
张鸿云
方健
王之元
赵夏
胡海韵
隋京高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Defense Technology Innovation Institute PLA Academy of Military Science
Original Assignee
National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Defense Technology Innovation Institute PLA Academy of Military Science filed Critical National Defense Technology Innovation Institute PLA Academy of Military Science
Priority to CN202010644877.XA priority Critical patent/CN111815410B/zh
Publication of CN111815410A publication Critical patent/CN111815410A/zh
Application granted granted Critical
Publication of CN111815410B publication Critical patent/CN111815410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于选择性邻域信息的商品推荐方法,该方法包括:获取目标用户的兴趣偏好;获取商品的属性特征;获取与商品有过历史评分记录的所有用户,将所有用户作为目标用户在商品下的邻域信息并确定其兴趣偏好;确定目标用户与邻域信息中每个用户的兴趣偏好的相似性;对邻域信息的兴趣偏好进行融合以得到目标用户的邻域特征信息;确定邻域特征信息的可用性;获取基于邻域信息的目标用户特征信息;获取目标用户对商品的预测评分;选择预测评分最大的若干个商品推荐给目标用户。本发明的方法将邻域信息当作一种辅助信息,自动过滤出相似邻域信息,捕获用户与其邻域信息之间兴趣偏好的一致性,能够有效缓解数据稀疏性问题,显著提高推荐精度。

Description

基于选择性邻域信息的商品推荐方法
技术领域
本发明涉及商品推荐系统技术领域,尤其涉及一种基于选择性邻域信息的商品推荐方法。
背景技术
个性化推荐技术主要分析不同用户的行为,猜测用户兴趣,主动向用户推荐资源,从而缓解了互联网信息爆炸与用户快速获取信息之间的矛盾,也弥补了通用搜索引擎个性化反馈结果能力弱的缺点。
随着电子商务的不断发展,规模的不断扩大,商品的个数和种类也快速的增加,这使得顾客在挑选所需的商品上,会花费大量的时间,在较短的时间购买到适合自己的商品,已经成为网络购物的发展方向。基于海量数据分析与数据挖掘技术的推荐服务也因此成为各大电子商务网站使用的技术之一。
推荐系统是一种典型的信息过滤工具,推荐系统通常通过用户和商品之间的历史交互记录,捕获用户对商品的兴趣偏好,以便更快的将用户感兴趣的商品优先呈现给他们。一个推荐问题,通常情况下可描述为用户和商品之间的评分预测问题,即给定用户和商品之间已经完成的评分记录,来预测缺失的评分记录,并据此给用户推荐评分高的商品。然而,在实际应用中,由于和网络平台中数目庞大的商品相比,大多数用户仅跟极少数商品具有历史交互记录,而仅根据这些少量的交互数据,无法全面捕获用户的兴趣偏好和商品的属性特征,使推荐系统面临着严重的数据稀疏性和冷启动问题,导致推荐系统的推荐性能指标收到限制,推荐效果差。
为解决上述问题,目前通过利用辅助性信息来缓解数据稀疏性和冷启动困难的问题,以降低推荐决策的不确定性,提高推荐效果。近年来,随着互联网的普及,社交网络数据成为最常被推荐系统利用的一种辅助性信息。在一个社交网络上,用户可以被看成一个个节点,用户之间的关系可以用连接节点之间的边来表示,根据社交网络的不同,边的定义有所不同;比如两个用户之间存在一条边,可以解释为两个用户之间的“关注”或者“好友”关系。对于一个用户而言,与其存在边连接的所有其他用户称为该用户的邻域。由于社交网络上的节点(即用户)通常具有同质性,具体而言,两个用户之间的边的权重越大,那么大概率上两个用户具有相同兴趣偏好,因此在缺少用户与商品的交互数据的情况下,可以根据用户的邻域信息来对该用户的兴趣偏好进行预测,从而确定推荐给该用户的商品。
虽然现有的推荐方法通过利用邻域信息作为辅助性信息能够提高推荐效果;但是,现有的推荐方法在使用时不加区别地将邻域信息引入推荐处理过程,忽视了邻域信息对用户的可用性存在着个体差异性,由于有些用户的兴趣偏好并不依赖于该用户的邻域信息,不加区分的引入邻域信息,反而给推荐处理过程引入了干扰信息,影响推荐性能,使推荐效果变差;此外,现有的推荐方法在引入邻域信息时,并没有显式地对用户与该用户的邻域之间地语义相似性进行建模,导致无法高效地捕获用户与该用户的邻域之间的相似性,推荐效果不佳。
发明内容
为解决上述现有技术中存在的技术问题,本发明提供一种基于选择性邻域信息的商品推荐方法。
为此,本发明公开了一种基于选择性邻域信息的商品推荐方法,所述方法用于确定推荐给用户的商品,包括如下内容:
1)确定需要进行商品推荐的目标用户,获取目标用户的兴趣偏好;
2)获取网站平台中与目标用户没有评分记录的一个商品,并确定商品对应的属性特征;
3)获取网站平台中与商品有过历史评分记录的所有用户,将所有用户作为目标用户在商品下的邻域信息,并确定邻域信息的兴趣偏好,邻域信息的兴趣偏好为邻域信息中所有用户的兴趣偏好组成的信息集合;
4)计算确定目标用户与邻域信息中每个用户的兴趣偏好的相似性;
5)根据目标用户与邻域信息中每个用户的兴趣偏好的相似性,对邻域信息的兴趣偏好进行加权和操作的融合以得到目标用户的邻域特征信息,邻域信息中每个用户对应的权重为其与目标用户的兴趣偏好的相似性;
6)设定目标用户对应的邻域信息相似性门限值,将邻域信息中与目标用户的相似性的分值小于邻域信息相似性门限值的所有用户划分到非相似邻域并计算确定非相似邻域的相似性的均值,将邻域信息中与目标用户的相似性的分值大于等于邻域信息相似性门限值的所有用户划分到相似邻域并计算确定相似邻域的相似性的均值,根据非相似邻域的相似性的均值和相似邻域的相似性的均值计算确定邻域特征信息的可用性;
7)基于邻域特征信息的可用性,对目标用户的邻域特征信息和目标用户的兴趣偏好进行融合处理,获取基于邻域信息的目标用户特征信息;
8)对基于邻域信息的目标用户特征信息和商品的属性特征之间的交互进行建模,获取目标用户对商品的预测评分;
9)从与目标用户没有评分记录的所有商品中选择预测评分最大的若干个商品推荐给目标用户。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤4)中,运用注意力机制模型计算目标用户与其邻域信息中每个用户的兴趣偏好的相似性。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤4)中,采用以下公式计算目标用户与其邻域信息中每个用户的兴趣偏好的相似性;
Figure BDA0002572766940000031
Figure BDA0002572766940000032
其中,矩阵
Figure BDA0002572766940000033
矩阵
Figure BDA0002572766940000034
向量v和向量bu为注意力机制模型参数,tanh为非线性变换函数,
Figure BDA0002572766940000035
Figure BDA0002572766940000036
为向量的点乘操作,N(vj)={u1,u2,...,ut}表示目标用户ui在商品vj下的邻域信息,ut表示邻域信息中的第t个用户,βt表示目标用户ui与其邻域用户ut的兴趣偏好的相似性的中间结果,αt表示目标用户ui与其邻域用户ut对商品vj的兴趣偏好的相似性分值。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤5)中,利用以下公式确定目标用户的邻域特征信息;
Figure BDA0002572766940000037
其中,向量pi表示目标用户ui的邻域特征信息。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤6)中,利用以下公式确定邻域特征信息的可用性;
f(θi)=σ((tsi)(θi-td))-0.5
其中,f(θi)表示邻域特征信息的可用性分值,σ为非线性变化递增函数,
Figure BDA0002572766940000038
该函数的意义为将输入x映射到[0,1]之间,ts表示相似邻域的相似性的均值,td表示非相似邻域的相似性的均值。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤7)包括以下内容:
根据门网络机制模型权衡目标用户的兴趣偏好及其邻域特征信息,得到相应的门网络机制值,根据门网络机制值和邻域特征信息的可用性,将目标用户的兴趣偏好及其邻域特征信息进行融合,得到基于邻域信息的目标用户特征信息。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤7)中,采用以下公式对目标用户的邻域特征信息和目标用户的兴趣偏好进行融合处理,获取基于邻域信息的目标用户特征信息;
Figure BDA0002572766940000041
Figure BDA0002572766940000042
其中,矩阵
Figure BDA0002572766940000043
矩阵
Figure BDA0002572766940000044
和向量bg为门网络机制模型参数,σ为非线性变化递增函数,hi表示基于邻域信息的目标用户特征信息,g表示门网络机制值。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤8)中,运用多层神经网络模型对基于邻域信息的目标用户特征信息和商品的属性特征之间的交互进行建模,以获取目标用户对商品的预测评分。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,步骤8)中,利用以下公式获取目标用户对商品的预测评分;
Figure BDA0002572766940000045
其中,
Figure BDA0002572766940000046
表示目标用户ui对商品vj的预测评分,[;]表示向量的拼接操作,
Figure BDA0002572766940000047
为向量的点乘操作,L表示神经网络的层数,φl表示第l层神经网络,zl-1表示第l-1层神经网络的输出,σl表示第l层神经网络的激活函数,矩阵Wl T和向量bl表示第l层神经网络参数,hi表示基于邻域信息的目标用户特征信息,向量vj表示商品vj的属性特征,第l层神经网络以第l-1层网络的输出zl-1作为输入,并输出zl,作为第l+1层神经网络的输入,以此类推,最后一层网络输出标量
Figure BDA0002572766940000048
作为目标用户ui对商品vj的预测评分。
进一步地,在上述基于选择性邻域信息的商品推荐方法中,商品包括有形的产品、无形的服务和信息。
本发明技术方案的主要优点如下:
本发明的基于选择性邻域信息的商品推荐方法将邻域信息当作一种辅助信息,基于邻域信息的可用性,自动过滤出相似邻域信息,同时对用户与其邻域信息之间的相似性进行建模,捕获用户与其邻域信息之间兴趣偏好的一致性,能够有效缓解数据稀疏性问题,显著提高推荐精度和推荐效果。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一实施例的基于选择性邻域信息的商品推荐方法的流程图;
图2为本发明一实施例的基于选择性邻域信息的商品推荐方法的总体流程框图;
图3为本发明一实施例的基于选择性邻域信息的商品推荐方法的模型训练过程框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合附图,详细说明本发明实施例提供的技术方案。
如附图1所示,本发明一实施例提供了一种基于选择性邻域信息的商品推荐方法,该方法用于确定推荐给用户的商品,包括如下内容:
1)确定需要进行商品推荐的目标用户,获取目标用户的兴趣偏好;
2)获取网站平台中与目标用户没有评分记录的一个商品,并确定商品对应的属性特征;
3)获取网站平台中与商品有过历史评分记录的所有用户,将所有用户作为目标用户在商品下的邻域信息,并确定邻域信息的兴趣偏好,邻域信息的兴趣偏好为邻域信息中所有用户的兴趣偏好组成的信息集合;
4)计算确定目标用户与邻域信息中每个用户的兴趣偏好的相似性;
5)根据目标用户与邻域信息中每个用户的兴趣偏好的相似性,对邻域信息的兴趣偏好进行加权和操作的融合以得到目标用户的邻域特征信息,邻域信息中每个用户对应的权重为其与目标用户的兴趣偏好的相似性;
6)设定目标用户对应的邻域信息相似性门限值,将邻域信息中与目标用户的相似性的分值小于邻域信息相似性门限值的所有用户划分到非相似邻域并计算确定非相似邻域的相似性的均值,将邻域信息中与目标用户的相似性的分值大于等于邻域信息相似性门限值的所有用户划分到相似邻域并计算确定相似邻域的相似性的均值,根据非相似邻域的相似性的均值和相似邻域的相似性的均值计算确定邻域特征信息的可用性;
7)基于邻域特征信息的可用性,对目标用户的邻域特征信息和目标用户的兴趣偏好进行融合处理,获取基于邻域信息的目标用户特征信息;
8)对基于邻域信息的目标用户特征信息和商品的属性特征之间的交互进行建模,获取目标用户对商品的预测评分;
9)从与目标用户没有评分记录的所有商品中选择预测评分最大的若干个商品推荐给目标用户。
本发明一实施例中,预测评分的大小表示相应的商品符合目标用户的兴趣偏好的程度,推荐的过程就是将预测评分大的商品优先推荐给目标用户。
本发明一实施例中,商品包括有形的产品、无形的服务和信息;与商品有过历史评分记录的用户表示购买过、使用过、或/和评价过该商品的用户,相应地,用户与商品没有评分记录表示该用户未购买过、未使用过和未评价过该商品。
假设网站平台中的任意一对用户和商品用<ui,vj>表示,ui表示第i个用户,vj表示第j个商品;对于一对用户和商品<ui,vj>中的用户ui和商品vj,通过嵌入检索(embedding lookup)操作,分别获取用户的兴趣偏好和商品的属性特征,用户ui的兴趣偏好以一个嵌入向量ui表示,商品vj的属性特征以一个嵌入向量vj表示。嵌入检索是一个1对1的映射,将一个用户ui(商品vj)对应唯一一个嵌入向量ui(vj),嵌入向量可以从各种显式信息源里面提取出来,当没有显式信息源时,可以根据用户与商品的交互记录中学习的,因此嵌入向量为模型参数,需要在模型训练中自动学习更新。
设定:第j个用户ui为目标用户,第j个商品vj为与目标用户ui没有评分记录的一个商品,以获取目标用户ui对商品vj的预测评分为例,对本发明一实施例的商品推荐方法的步骤及原理进行具体说明。
如附图2所示,当需要获取目标用户ui对商品vj的预测评分时,第一步,通过嵌入检索(embedding lookup)操作,获取目标用户ui的兴趣偏好ui
第二步,通过嵌入检索操作,获取商品vj的属性特征vj
具体操作为:假设平台中的用户嵌入矩阵可表示为U∈RM×d,其中M为所有用户的个数,d为嵌入向量的维度,那么用户嵌入矩阵U中ui所对应的行向量即为ui的嵌入向量ui;同理,假设平台中的商品嵌入矩阵可表示为V∈RN×d,其中N为所有商品的个数,d为嵌入向量的维度,那么商品嵌入矩阵V中vj所对应的行向量即为vj的嵌入向量vj
第三步,确定目标用户ui在商品vj下的邻域信息及其对应的兴趣偏好。
由于一个用户的邻域可以看成是与该用户在社交网络上相邻的节点,根据社交网络的同质性,一个用户与其邻域在兴趣偏好上具有相似性;为此,在本发明一实施例的推荐方法中,针对网站平台中的任意一对用户和商品<ui,vj>,该商务网站中所有对该商品vj有过历史评分记录的用户被认定为该用户ui的邻域信息。本发明一实施例中,用户ui的邻域信息以N(vj)={u1,u2,...,ut}表示,ut表示邻域信息中的第t个用户,当确定邻域信息所包含的用户后,通过嵌入检索操作获取邻域信息中每个用户的兴趣偏好,得到邻域信息N(vj)={u1,u2,...,ut}对应的兴趣偏好{u1,u2,...,ut},ut表示邻域信息中的第t个用户ut对应的兴趣偏好。
第四步,计算确定目标用户ui与邻域信息N(vj)={u1,u2,...,ut}中每个用户的兴趣偏好的相似性。
本发明一实施例中,运用注意力机制模型计算目标用户ui与其邻域信息N(vj)={u1,u2,...,ut}中每个用户的兴趣偏好的相似性。具体地,利用以下公式计算目标用户ui与其邻域信息N(vj)={u1,u2,...,ut}中每个用户的兴趣偏好的相似性;
Figure BDA0002572766940000071
Figure BDA0002572766940000072
其中,矩阵
Figure BDA0002572766940000081
矩阵
Figure BDA0002572766940000082
向量v和向量bu为注意力机制模型参数,tanh为非线性变换函数,
Figure BDA0002572766940000083
Figure BDA0002572766940000084
为向量的点乘操作,βt表示目标用户ui与其邻域用户ut的兴趣偏好的相似性的中间结果,αt表示目标用户ui与其邻域用户ut的兴趣偏好的相似性的归一化结果,即αt表示目标用户ui与其邻域用户ut对商品vj的兴趣偏好的相似性分值,注意力机制模型参数需要在模型训练中进行更新优化。
第五步,根据目标用户ui与邻域信息N(vj)={u1,u2,...,ut}中每个用户的兴趣偏好的相似性,对邻域信息N(vj)={u1,u2,...,ut}的兴趣偏好进行加权和操作的融合以得到目标用户ui的邻域特征信息。
具体地,本发明一实施例中,利用以下公式确定目标用户ui的邻域特征信息;
Figure BDA0002572766940000085
其中,向量pi表示目标用户ui的邻域特征信息;该步骤中,相似性分值实际可以看成每个邻域用户对应的权重值,在加权和操作过程中,与目标用户相似性较高的邻域用户会被赋予更高的权重。
第六步,设定目标用户ui对应的邻域信息相似性门限值θi,将邻域信息N(vj)={u1,u2,...,ut}中与目标用户ui的相似性的分值小于邻域信息相似性门限值θi的所有用户划分到非相似邻域并计算确定非相似邻域的相似性的均值,将邻域信息N(vj)={u1,u2,...,ut}中与目标用户ui的相似性的分值大于等于邻域信息相似性门限值θi的所有用户划分到相似邻域并计算确定相似邻域的相似性的均值,根据非相似邻域的相似性的均值和相似邻域的相似性的均值计算确定邻域特征信息的可用性。
具体地,本发明一实施例中,利用以下公式确定邻域特征信息的可用性;
f(θi)=σ((tsi)(θi-td))-0.5
其中,f(θi)表示邻域特征信息的可用性分值,σ为非线性变化递增函数,
Figure BDA0002572766940000091
该函数的意义为将输入x映射到[0,1]之间,ts表示相似邻域的相似性的均值,td表示非相似邻域的相似性的均值,相似邻域的相似性的均值为相似邻域所包含的所有用户的相似性的均值,非相似邻域的相似性的均值为非相似邻域所包含的所有用户对应的相似性的均值。
该步骤根据目标用户与其邻域信息之间的相似性对邻域特征信息可用性进行建模,其基本原理是通过相似邻域和非相似邻域的区分度来确定邻域特征信息的可用性,例如如果无法明确地将相似邻域从其邻域信息中区分出来,说明邻域信息带有很大的不确定性,邻域特征信息的可用性不高,对应的f(θi)数值较小,应当在推荐决策过程中降低对邻域信息的依赖;如果能够显著地区分相似邻域和非相似邻域,说明邻域信息的不确定性小,邻域特征信息的可用性很高,对应的f(θi)数值也较大,该步骤构成了邻域信息建模的第一步。
本发明一实施例中,每个目标用户对应一个邻域信息相似性门限值,该邻域信息相似性门限值为模型参数,需要在模型训练中进行更新优化。
第七步,基于邻域特征信息的可用性f(θi),对目标用户ui的邻域特征信息pi和目标用户ui的兴趣偏好ui进行融合处理,获取基于邻域信息的目标用户特征信息。
本发明一实施例中,运用门网络机制模型对目标用户ui的邻域特征信息pi和目标用户ui的兴趣偏好ui进行融合处理,获取基于邻域信息的目标用户特征信息。首先,根据门网络机制模型来权衡目标用户ui的兴趣偏好ui及其邻域特征信息pi,得到相应的门网络机制值g,该步骤构成了邻域信息建模的第二步;然后,根据得到的门网络机制值g和第六步中得到的邻域特征信息的可用性f(θi),将目标用户ui的兴趣偏好ui及其邻域特征信息pi进行融合,得到基于邻域信息的目标用户特征信息。
具体地,利用以下公式对目标用户ui的邻域特征信息pi和目标用户ui的兴趣偏好ui进行融合处理,获取基于邻域信息的目标用户特征信息;
Figure BDA0002572766940000092
Figure BDA0002572766940000093
其中,矩阵
Figure BDA0002572766940000101
矩阵
Figure BDA0002572766940000102
和向量bg为门网络机制模型参数,σ为非线性变化递增函数,hi表示基于邻域信息的目标用户特征信息,g表示门网络机制值,门网络机制模型参数需要在模型训练中进行更新优化。
利用上述公式计算目标用户特征信息hi体现了使用双重选择性机制对邻域信息进行过滤,从而提取有效的邻域信息;一是基于邻域特征信息可用性f(θi)的计算,即如果目标用户的相似邻域和非相似邻域能够被显著地区分,那么f(θi)的数值接近0.5,即在计算目标用户特征信息hi过程中赋予ui和pi同样的权重,如果无法显著区分目标用户的相似邻域和非相似邻域,那么f(θi)的数值接近0,那么在计算目标用户特征信息hi过程中pi的权重将被降低;二是门网络机制值g的计算,是根据目标用户和其邻域信息,动态地在两者之间进行权衡。
第八步,对基于邻域信息的目标用户特征信息hi和商品vj的属性特征vj之间的交互进行建模,获取目标用户ui对商品vj的预测评分。
本发明一实施例中,运用多层神经网络模型对基于邻域信息的目标用户特征信息hi和商品vj的属性特征vj之间的交互进行建模,以获取目标用户ui对商品vj的预测评分。具体地,利用以下公式获取目标用户ui对商品vj的预测评分;
Figure BDA0002572766940000103
其中,
Figure BDA0002572766940000104
表示目标用户ui对商品vj的预测评分,[;]表示向量的拼接操作,
Figure BDA0002572766940000105
为向量的点乘操作,L表示神经网络的层数,φl表示第l层神经网络,zl-1表示第l-1层神经网络的输出,σl表示第l层神经网络的激活函数,矩阵Wl T和向量bl表示第l层神经网络参数,第l层神经网络以第l-1层网络的输出zl-1作为输入,并输出zl,作为第l+1层神经网络的输入,以此类推,最后一层网络输出标量
Figure BDA0002572766940000106
作为目标用户ui对商品vj的预测评分,神经网络参数需要在模型训练中进行更新优化。
第九步,参照上述的第一步至第八步所述的处理方式,依次获取目标用户ui对与其没有评分记录的所有商品的预测评分,从与目标用户ui没有评分记录的所有商品中选择预测评分最大的若干个商品推荐给目标用户。
其中,选择推荐给目标用户ui的商品数目可以根据实际需求进行设定。
如上述,本发明一实施例中,各个模型参数通过模型训练进行更新优化,对于如何进行模型训练以确定各个模型参数,以下进行具体说明说明。
如附图3所示,本发明一实施例中,模型训练指的是,对于每一对已有真实评分记录的用户和商品<ui,vj>,以及用户对应的邻域信息N(vj)={u1,u2,...,ut},先根据初始设定的各个模型参数,输出预测评分
Figure BDA0002572766940000111
而后计算预测评分
Figure BDA0002572766940000112
和对应的真实评分rij之间的误差,采用优化算法,误差进行反向传播,从而调整模型参数;模型训练是一个迭代过程,通过训练集对模型进行训练,不断调整优化模型参数,使得根据更新后的模型参数所获得的预测评分和真实评分的误差达到最小值;其中,采用商品、对商品具有历史评分记录的用户及其对应的邻域信息作为训练集,训练集的数目可以根据实际推荐精度要求进行确定。
本发明一实施例中,在进行模型训练时的优化目标分为两个部分;一是计算预测评分与真实评分之间的误差,优化此目标即是最小化此项误差,等价于提高模型预测精度;本发明一实施例中,使用二分类交叉熵定义第一个优化目标,具体可表述为:
Figure BDA0002572766940000113
其中,D表示训练集数据。
二是计算每个用户在其邻域信息概率分布上出现的概率,优化此目标即是最大化此项概率,等价于捕获用户与其邻域信息之间的相似性,具体可表述为:
Figure BDA0002572766940000114
其中,D表示训练集数据。
本发明一实施例中,用一个用户的邻域特征信息预测该用户的兴趣偏好,以此来最大化该用户在其邻域上的概率分布,从而对用户与其邻域信息的关系进行显式建模。
模型训练过程就是最小化上述的优化目标,本发明一实施例采用梯度下降法对优化目标进行求解,具体可表述为:
Figure BDA0002572766940000121
其中,θ表示前述模型所有参数的集合,lr表示学习率,θt表示第t次模型迭代之后的结果,
Figure BDA0002572766940000122
表示优化目标关于模型参数的偏导,即优化目标关于模型参数的梯度的方向,模型训练是一个迭代的过程,模型训练过程可理解为研究优化目标梯度方向调整模型参数,最小化优化目标。
本发明一实施例提供的基于选择性邻域信息的商品推荐方法将邻域信息当作一种辅助信息,基于邻域信息的可用性,自动过滤出相似邻域信息,同时对用户与其邻域信息之间的相似性进行建模,捕获用户与其邻域信息之间兴趣偏好的一致性,能够有效缓解数据稀疏性问题,显著提高推荐精度和推荐效果。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外,本文中“前”、“后”、“左”、“右”、“上”、“下”均以附图中表示的放置状态为参照。
最后应说明的是:以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种基于选择性邻域信息的商品推荐方法,其特征在于,所述方法用于确定推荐给用户的商品,包括如下内容:
1)确定需要进行商品推荐的目标用户,获取目标用户的兴趣偏好;
2)获取网站平台中与目标用户没有评分记录的一个商品,并确定商品对应的属性特征;
3)获取网站平台中与商品有过历史评分记录的所有用户,将所有用户作为目标用户在商品下的邻域信息,并确定邻域信息的兴趣偏好,邻域信息的兴趣偏好为邻域信息中所有用户的兴趣偏好组成的信息集合;
4)计算确定目标用户与邻域信息中每个用户的兴趣偏好的相似性;
5)根据目标用户与邻域信息中每个用户的兴趣偏好的相似性,对邻域信息的兴趣偏好进行加权和操作的融合以得到目标用户的邻域特征信息,邻域信息中每个用户对应的权重为其与目标用户的兴趣偏好的相似性;
6)设定目标用户对应的邻域信息相似性门限值,将邻域信息中与目标用户的相似性的分值小于邻域信息相似性门限值的所有用户划分到非相似邻域并计算确定非相似邻域的相似性的均值,将邻域信息中与目标用户的相似性的分值大于等于邻域信息相似性门限值的所有用户划分到相似邻域并计算确定相似邻域的相似性的均值,根据非相似邻域的相似性的均值和相似邻域的相似性的均值计算确定邻域特征信息的可用性;
7)基于邻域特征信息的可用性,对目标用户的邻域特征信息和目标用户的兴趣偏好进行融合处理,获取基于邻域信息的目标用户特征信息;
8)对基于邻域信息的目标用户特征信息和商品的属性特征之间的交互进行建模,获取目标用户对商品的预测评分;
9)从与目标用户没有评分记录的所有商品中选择预测评分最大的若干个商品推荐给目标用户。
2.根据权利要求1所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤4)中,运用注意力机制模型计算目标用户与其邻域信息中每个用户的兴趣偏好的相似性。
3.根据权利要求2所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤4)中,采用以下公式计算目标用户与其邻域信息中每个用户的兴趣偏好的相似性;
Figure FDA0002572766930000011
Figure FDA0002572766930000012
其中,矩阵
Figure FDA0002572766930000013
矩阵
Figure FDA0002572766930000014
向量v和向量bu为注意力机制模型参数,tanh为非线性变换函数,
Figure FDA0002572766930000021
°为向量的点乘操作,N(vj)={u1,u2,...,ut}表示目标用户ui在商品vj下的邻域信息,ut表示邻域信息中的第t个用户,βt表示目标用户ui与其邻域用户ut的兴趣偏好的相似性的中间结果,αt表示目标用户ui与其邻域用户ut对商品vj的兴趣偏好的相似性分值。
4.根据权利要求3所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤5)中,利用以下公式确定目标用户的邻域特征信息;
Figure FDA0002572766930000022
其中,向量pi表示目标用户ui的邻域特征信息。
5.根据权利要求4所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤6)中,利用以下公式确定邻域特征信息的可用性;
f(θi)=σ((tsi)(θi-td))-0.5
其中,f(θi)表示邻域特征信息的可用性分值,σ为非线性变化递增函数,
Figure FDA0002572766930000023
该函数的意义为将输入x映射到[0,1]之间,ts表示相似邻域的相似性的均值,td表示非相似邻域的相似性的均值。
6.根据权利要求5所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤7)包括以下内容:
根据门网络机制模型权衡目标用户的兴趣偏好及其邻域特征信息,得到相应的门网络机制值,根据门网络机制值和邻域特征信息的可用性,将目标用户的兴趣偏好及其邻域特征信息进行融合,得到基于邻域信息的目标用户特征信息。
7.根据权利要求6所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤7)中,采用以下公式对目标用户的邻域特征信息和目标用户的兴趣偏好进行融合处理,获取基于邻域信息的目标用户特征信息;
Figure FDA0002572766930000024
Figure FDA0002572766930000025
其中,矩阵
Figure FDA0002572766930000031
矩阵
Figure FDA0002572766930000032
和向量bg为门网络机制模型参数,σ为非线性变化递增函数,hi表示基于邻域信息的目标用户特征信息,g表示门网络机制值。
8.根据权利要求1至7中任一项所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤8)中,运用多层神经网络模型对基于邻域信息的目标用户特征信息和商品的属性特征之间的交互进行建模,以获取目标用户对商品的预测评分。
9.根据权利要求8所述的基于选择性邻域信息的商品推荐方法,其特征在于,步骤8)中,利用以下公式获取目标用户对商品的预测评分;
Figure FDA0002572766930000033
Figure FDA0002572766930000034
Figure FDA0002572766930000035
其中,
Figure FDA0002572766930000036
表示目标用户ui对商品vj的预测评分,[;]表示向量的拼接操作,°为向量的点乘操作,L表示神经网络的层数,φl表示第l层神经网络,zl-1表示第l-1层神经网络的输出,σl表示第l层神经网络的激活函数,矩阵
Figure FDA0002572766930000037
和向量bl表示第l层神经网络参数,hi表示基于邻域信息的目标用户特征信息,向量vj表示商品vj的属性特征,第l层神经网络以第l-1层网络的输出zl-1作为输入,并输出zl,作为第l+1层神经网络的输入,以此类推,最后一层网络输出标量
Figure FDA0002572766930000038
作为目标用户ui对商品vj的预测评分。
10.根据权利要求1至9中任一项所述的基于选择性邻域信息的商品推荐方法,其特征在于,商品包括有形的产品、无形的服务和信息。
CN202010644877.XA 2020-07-07 2020-07-07 基于选择性邻域信息的商品推荐方法 Active CN111815410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010644877.XA CN111815410B (zh) 2020-07-07 2020-07-07 基于选择性邻域信息的商品推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010644877.XA CN111815410B (zh) 2020-07-07 2020-07-07 基于选择性邻域信息的商品推荐方法

Publications (2)

Publication Number Publication Date
CN111815410A true CN111815410A (zh) 2020-10-23
CN111815410B CN111815410B (zh) 2022-04-26

Family

ID=72843064

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010644877.XA Active CN111815410B (zh) 2020-07-07 2020-07-07 基于选择性邻域信息的商品推荐方法

Country Status (1)

Country Link
CN (1) CN111815410B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862007A (zh) * 2021-03-29 2021-05-28 山东大学 基于用户兴趣编辑的商品序列推荐方法及系统
JP7460703B2 (ja) 2021-08-06 2024-04-02 楽天グループ株式会社 共有されたニューラルアイテム表現をコールドスタート推薦に用いる改良型のレコメンダシステム及び方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609533A (zh) * 2012-02-15 2012-07-25 中国科学技术大学 一种基于核方法的协同过滤推荐系统及方法
CN103377250A (zh) * 2012-04-27 2013-10-30 杭州载言网络技术有限公司 基于邻域的top-k推荐方法
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
CN110502704A (zh) * 2019-08-12 2019-11-26 山东师范大学 一种基于注意力机制的群组推荐方法及系统
CN110968793A (zh) * 2019-11-11 2020-04-07 辽宁师范大学 基于协同过滤混合填充的用户冷启动推荐算法
US20200167849A1 (en) * 2017-01-31 2020-05-28 Walmart Apollo, Llc Systems and methods for recommending cold-start items on a website of a retailer

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609533A (zh) * 2012-02-15 2012-07-25 中国科学技术大学 一种基于核方法的协同过滤推荐系统及方法
CN103377250A (zh) * 2012-04-27 2013-10-30 杭州载言网络技术有限公司 基于邻域的top-k推荐方法
CN108205682A (zh) * 2016-12-19 2018-06-26 同济大学 一种用于个性化推荐的融合内容和行为的协同过滤方法
US20200167849A1 (en) * 2017-01-31 2020-05-28 Walmart Apollo, Llc Systems and methods for recommending cold-start items on a website of a retailer
CN110502704A (zh) * 2019-08-12 2019-11-26 山东师范大学 一种基于注意力机制的群组推荐方法及系统
CN110968793A (zh) * 2019-11-11 2020-04-07 辽宁师范大学 基于协同过滤混合填充的用户冷启动推荐算法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张天龙等: "基于全局与局部相融合的方面注意力推荐模型", 《中国科技论文》 *
熊海涛: "《面向复杂数据的推荐分析研究》", 31 January 2015, 北京理工大学出版社 *
端德坤等: "混合协同过滤算法中用户冷启动问题的研究", 《计算机工程与应用》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112862007A (zh) * 2021-03-29 2021-05-28 山东大学 基于用户兴趣编辑的商品序列推荐方法及系统
CN112862007B (zh) * 2021-03-29 2022-12-13 山东大学 基于用户兴趣编辑的商品序列推荐方法及系统
JP7460703B2 (ja) 2021-08-06 2024-04-02 楽天グループ株式会社 共有されたニューラルアイテム表現をコールドスタート推薦に用いる改良型のレコメンダシステム及び方法

Also Published As

Publication number Publication date
CN111815410B (zh) 2022-04-26

Similar Documents

Publication Publication Date Title
CN108648049B (zh) 一种基于用户行为区别建模的序列推荐方法
CN110717098B (zh) 基于元路径的上下文感知用户建模方法、序列推荐方法
CN112765486B (zh) 一种融合知识图谱的注意力机制的电影推荐方法
CN110969516A (zh) 一种商品推荐方法及装置
CN109783738B (zh) 一种基于多相似度的双极限学习机混合协同过滤推荐方法
CN109255586B (zh) 一种面向电子政务办事的在线个性化推荐方法
CN109087178A (zh) 商品推荐方法和装置
CN110889747B (zh) 商品推荐方法、装置、系统、计算机设备及存储介质
CN109189921B (zh) 评论评估模型的训练方法和装置
CN112115377A (zh) 一种基于社交关系的图神经网络链路预测推荐方法
CN110321473B (zh) 基于多模态注意力的多样性偏好信息推送方法、系统、介质及设备
CN111815410B (zh) 基于选择性邻域信息的商品推荐方法
CN113190751B (zh) 一种融合关键词生成的推荐方法
CN113191838A (zh) 一种基于异质图神经网络的购物推荐方法及系统
CN111460819A (zh) 基于细粒度情感分析的个性化评论文本推荐系统及推荐方法
Akhil et al. A survey of recommender system types and its classification.
CN114386513A (zh) 一种集成评论与评分的交互式评分预测方法及系统
CN112256916A (zh) 一种基于图胶囊网络的短视频点击率预测方法
Ahamed et al. A recommender system based on deep neural network and matrix factorization for collaborative filtering
CN113610610B (zh) 基于图神经网络和评论相似度的会话推荐方法和系统
Fareed et al. A collaborative filtering recommendation framework utilizing social networks
Nazari et al. Scalable and data-independent multi-agent recommender system using social networks analysis
CN116452293A (zh) 一种融合物品受众特征的深度学习推荐方法及系统
CN115481325A (zh) 基于用户全局兴趣迁移感知的个性化新闻推荐方法及系统
CN115238188A (zh) 一种对象推荐方法和系统及对象推荐模型系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant