CN110348919A - 物品推荐方法、装置和计算机可读存储介质 - Google Patents
物品推荐方法、装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN110348919A CN110348919A CN201810280221.7A CN201810280221A CN110348919A CN 110348919 A CN110348919 A CN 110348919A CN 201810280221 A CN201810280221 A CN 201810280221A CN 110348919 A CN110348919 A CN 110348919A
- Authority
- CN
- China
- Prior art keywords
- article
- vector
- user
- shopping
- characteristics vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000013598 vector Substances 0.000 claims abstract description 203
- 238000012549 training Methods 0.000 claims abstract description 35
- 230000009466 transformation Effects 0.000 claims abstract description 35
- 238000013507 mapping Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 23
- 230000000694 effects Effects 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 239000004744 fabric Substances 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 9
- 238000012545 processing Methods 0.000 abstract description 3
- 238000009826 distribution Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开涉及一种物品推荐方法、装置和计算机可读存储介质,涉及大数据处理技术领域。该方法包括:据各用户的历史购物记录,计算相应的句子向量作为各用户的购物特征向量;根据各用户的社交属性,生成各用户的社交特征向量;以各社交特征向量为输入,以各购物特征向量为输出,训练向量变换模型;根据目标用户的社交特征向量和向量变换模型,得到目标用户的购物特征向量;根据目标用户的购物特征向量确定推荐物品。本公开的技术方案能够增强物品推荐的扩展性、扩大适用范围,并提高物品推荐的准确率、降低成本。
Description
技术领域
本公开涉及大数据处理技术领域,特别涉及一种物品推荐方法、物品推荐装置和计算机可读存储介质。
背景技术
近年来,电子商务与社交网络的界限越来越模糊。许多电子商务网站都支持使用社交网站的账户登录。也就是说,用户可以使用他们的社交网络身份在电子商务网站上进行登录,也可以在社交网站上分享购买的物品信息和电子商务物品网页的链接。利用这种联系可以向在电子商务网站购物的社交网络用户推荐物品。
相关技术根据用户在社交网站上的行为及其在电子商务网站上的行为,通过人工生成用户特征,从而进行物品推荐。
发明内容
本公开的发明人发现上述相关技术中存在如下问题:只能针对曾经在电子商务网站上购买过物品的用户进行物品推荐,导致相关技术的适用范围小、扩展性差;靠人工生成的用户特征受主观因素影响大,导致物品推荐不准确、人工成本高。针对上述问题中的至少一个问题,本公开提出了一种适用范围广、扩展性强的物品推荐技术方案。
根据本公开的一些实施例,提供了一种物品推荐方法,包括:根据各用户的历史购物记录,计算相应的句子向量作为所述各用户的购物特征向量;根据所述各用户的社交属性,生成所述各用户的社交特征向量;以各所述社交特征向量为输入,以各所述购物特征向量为输出,训练向量变换模型;根据目标用户的社交特征向量和所述向量变换模型,得到所述目标用户的购物特征向量;根据所述目标用户的购物特征向量确定推荐物品。
可选地,根据所述各用户的历史购物记录中的各物品ID,计算相应的词向量作为所述各物品的物品特征向量;根据所述目标用户的购物特征向量与所述各物品的物品特征向量之间的相似度,确定所述推荐物品。
可选地,将所述历史购物记录中包含的物品ID和用户ID作为词标记;将所述历史购物记录作为输入句子输入para2vec模型,所述para2vec模型的滑动上下文窗口始终包括所述用户ID,以计算出所述历史购物记录相应的句子向量。
可选地,按照所述历史购物记录中各物品的购买顺序,将所有物品ID组合为物品序列;将所述物品序列中与目标物品ID相邻的物品ID确定为所述目标物品ID的上下文;将所述物品序列输入item2vec模型,以计算各物品相应的词向量。
可选地,所述社交属性包括人口统计特征、用户发表文本的语言特征和用户发表文本的时间分布中的至少一项。
可选地,构建多个映射函数,各所述映射函数分别能够将用户的社交特征向量映射为所述用户的购物特征向量中的各元素;训练所述多个映射函数作为所述向量变换模型。
可选地,所述相似度为通过计算所述目标用户的购物特征向量与所述各物品的物品特征向量之间的夹角的余弦值确定。
根据本公开的另一些实施例,提供一种物品推荐装置,包括:购物特征向量获取模块,用于根据各用户的历史购物记录,计算相应的句子向量作为所述各用户的购物特征向量;社交特征向量获取模块,用于根据所述各用户的社交属性,生成所述各用户的社交特征向量;模型训练模块,用于以各所述社交特征向量为输入,以各所述购物特征向量为输出,训练向量变换模型;特征向量转换模块,用于根据目标用户的社交特征向量和所述向量变换模型,得到所述目标用户的购物特征向量;推荐物品确定模块,用于根据所述目标用户的购物特征向量确定推荐物品。
可选地,所述推荐物品确定模块根据所述各用户的历史购物记录中的各物品ID,计算相应的词向量作为所述各物品的物品特征向量,根据所述目标用户的购物特征向量与所述各物品的物品特征向量之间的相似度,确定所述推荐物品。
可选地,所述购物特征向量获取模块将所述历史购物记录中包含的物品ID和用户ID作为词标记,将所述历史购物记录作为输入句子输入para2vec模型,所述para2vec模型的滑动上下文窗口始终包括所述用户ID,以计算出所述历史购物记录相应的句子向量。
可选地,所述推荐物品确定模块按照所述历史购物记录中各物品的购买顺序,将所有物品ID组合为物品序列,将所述物品序列中与目标物品ID相邻的物品ID确定为所述目标物品ID的上下文,将所述物品序列输入item2vec模型,以计算各物品相应的词向量。
可选地,所述社交属性包括人口统计特征、用户发表文本的语言特征和用户发表文本的时间分布中的至少一项。
可选地,所述模型训练模块构建多个映射函数,各所述映射函数分别能够将用户的社交特征向量映射为所述用户的购物特征向量中的各元素,训练所述多个映射函数作为所述向量变换模型。
可选地,所述推荐物品确定模块通过计算所述目标用户的购物特征向量与所述各物品的物品特征向量之间的夹角的余弦值确定所述相似度。
根据本公开的又一些实施例,提供一种物品推荐装置,包括:存储器;和耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行上述任一个实施例所述的物品推荐方法。
根据本公开的再一些实施例,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一个实施例所述的物品推荐方法。
在上述实施例中,根据已经在电子商务网站过买过物品的用户的社交特征和购物特征训练变换模型,利用变换模型将未在电子商务网站购买过物品的用户的社交特征转换为购物特征。这样可以为电子商务网站的新用户推荐物品,从而增强了物品推荐的扩展性、扩大了适用范围。而且这样还可以自动分析用户的购物习惯,从而提高了物品推荐的准确率、降低了成本。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1示出本公开的物品推荐方法的一些实施例的流程图;
图2示出本公开的购物特征向量计算方法的一些实施例的流程图;
图3示出本公开的向量变换模型训练方法的一些实施例的流程图;
图4示出本公开的推荐物品确定方法的一些实施例的流程图;
图5示出本公开的物品特征向量确定方法的一些实施例的流程图;
图6示出本公开的物品推荐装置的一些实施例的框图;
图7示出本公开的物品推荐装置的又一些实施例的框图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
相关技术一般都需要在大量的用户购物数据的基础上进行物品推荐,因此无法对缺乏数据基础的新用户推荐物品,即无法实现物品推荐的“冷启动”。
在“冷启动”的条件下,只有用户的社交网络信息是可用的,因此,如何将用户的社交网络信息转化为可以有效用于物品推荐的购物特征是解决“冷启动”问题的关键。而且,一个新用户刚使用电子商务网站的“冷启动”物品推荐可能直接决定着这个用户还会不会继续使用下去,所以“冷启动”物品推荐至关重要。
根据上面的分析,本公开的发明人发现可以将既在社交网站上发表过文字又在电子商务网站上购买过物品的用户作为数据分析基础,将用户的社交网络特征映射到购物特征空间中。这样就可以建立社交特征与购物特征的联系,从而实现在“冷启动”的条件下为新用户推荐物品。下面通过一些实施例来说明本公开的技术方案。
图1示出本公开的物品推荐方法的一些实施例的流程图。
如图1所示,该方法包括:步骤110,计算各用户的购物特征向量;步骤120,计算各用户的社交特征向量;步骤130,训练向量变换模型;步骤140,获取目标用户的购物特征向量;和步骤150,确定目标用户的推荐物品。
在步骤110中,根据各用户的历史购物记录,计算相应的句子(Paragraph)向量作为各用户的购物特征向量。句子向量可以用一串实数表征一句话的含义。例如,可以从电商的大型电子商务数据集中获取某段日期内的所有活跃用户的交易记录数据。每个交易记录数据可以由用户ID和物品ID组成,交易记录数据还可以包括购买时间戳等其它信息。可以按用户ID对交易记录数据进行分组,获取每个用户购买的物品列表作为历史购物记录。
在一些实施例中,可以通过图2的步骤计算购物特征向量。
图2示出本公开的购物特征向量计算方法的一些实施例的流程图。
如图2所示,该方法包括:步骤1101,确定历史购物记录的词标记;和步骤1102,将历史购物记录输入para2vec模型。para2vec模型可以通过非监督学习方式获取“句子”(Paragraph)的语义特征,从而将“句子”转化为相应的数字信息——句子向量。
在步骤1101中,将历史购物记录中包含的物品ID和用户ID作为词标记。例如,用户的浏览或购买历史可以被认为是由物品ID序列组成的“句子”。可以将各用户ID被放置在各“句子”的开始处,并将用户ID和物品ID作为训练过程中的词汇表的词标记。
在步骤1102中,将历史购物记录作为输入句子输入para2vec模型,para2vec模型的滑动上下文窗口始终包括用户ID,以计算出历史购物记录相应的句子向量。
在一些实施例中,可以将用户ID作为para2vec模型的句子ID(Paragraph ID),即作为一个“句子”(物品ID序列)的代表。而且,在训练过程中,要保证各句子ID(用户ID)始终会出现在相应“句子”的每次滑窗训练中。例如,在训练过程中,每个“句子”的滑动上下文窗口始终包括该“句子”中的第一个“单词”,即用户ID。例如,滑动上下文窗口可以包含4个物品ID。
这样可以将用户ID与相应“句子”中的所有物品ID关联在一起,通过训练可以计算出各用户ID标记的物品ID序列相应的句子向量,从而将用户和物品特征映射到了同一个向量空间中,以便向用户推荐物品。下面可以继续通过图1中的步骤120获取用户的社交属性,以建立用户的社交特征和购物特征之间的关联。
在步骤120中,根据各用户的社交属性,生成各用户的社交特征向量。例如,社交属性可以包括人口统计特征、用户发表文本的语言特征和用户发表文本的时间分布中的至少一项。也可以将人口统计特征、用户发表文本的语言特征和用户发表文本的时间分布中的几项进行拼接,以形成用户的社交特征向量。
人口统计特征可以反映用户的特点、偏好等。用户在社交网站上发表的文本往往反映了他们对某些话题的看法和兴趣。用户发表文本的时间分布可以在一定程度上反映用户的生活习惯和生活方式。因此,人口统计特征、文本的语言特征和发表文本的时间分布与用户的购买偏好之间存在相关性,可以作为向用户推荐物品的参考数据。
在一些实施例中,可以从社交网站的公开个人资料中提取用户的人口统计特征。人口统计特征可以包括性别、年龄、婚姻状况、教育程度、职业和兴趣等。可以对人口统计特征进行离散化处理,以便定量测量这些特征。
在一些实施例中,可以从社交网站获取用户发表的文本,而且在提取文本的语言特征之前,还可以先进行中文分词和停用词删除。文本的语言特征可以包括文本的主题分布和平均词向量。
例如,可以将用户发表过的所有文本聚合到一个文档中,然后利用LDA(LatentDirichlet Allocation,潜在狄氏分配)模型来处理该文档以获取用户相应的主题分布。LDA模型可以用来识别大规模文档集或语料库中潜藏的主题信息,能够将每一篇文档视为一个词频向量,从而将文本信息转化为易于建模的数字信息。由于主题的总量相对于关键词而言比较少(通常可以设定为50-200个),这样就减少了生成的特征向量的维度,从而降低了处理负担、提高了处理效率。而且主题作为浓缩且有意义的语义单位,比关键词更容易解释和理解。
例如,可以利用word2vec模型中的Skip-gram模型来学习文本中单词的分布式向量表示。word2vec模型可以通过训练获取单词对应的数字信息——词向量,Skip-gram模型为word2vec模型的一种训练模型,可以是通过当前单词预测其上下文。得到词向量后,可以将用户所发布的文本中所有词向量的平均(即平均词向量)作为该用户的文本向量表示。一方面,由于词向量的每个维度都表示词的潜在特征,并且语义上相似的词在潜在特征空间中接近,因此利用平均词向量可以比较准确地表征文本的含义。另一方面,使用word2vec模型等神经网络模型来学习词向量表示,可以解决无法捕捉单词上下文语义的问题。
在一些实施例中,发表文本的时间分布可以包括日活动分布和周活动分布。例如,用户的日活动分布可以用24个分布比例为特征,第i个分布比例表示用户在一天的第i小时内发布的平均文本数量。例如,用户的周活动分布可以用7个分布比例为特征,第j个分布比例表示用户在一周的第j天内发布的平均文本数量。这样可以通过发表文本的时间分布表征用户的活动习惯,进而与用户的购物特征进行关联。
步骤110和步骤120中的用户都是既在电子商务网站上购买过物品又在社交网站上发表过文本的用户,可以作为购物特征和社交特征之间的“连接用户”。通过步骤110和步骤120可以获取这些用户的购物特征向量和社交特征向量,下面就可以通过步骤130计算它们之间的变换模型,以作为为新用户推荐物品的数据基础。
在步骤130中,以各社交特征向量为输入,以各购物特征向量为输出,训练向量变换模型。例如,可以针对每个用户构造一个特征向量对,该特征向量对中包含该用户的社交特征向量和购物特征向量。这样就可以将向量之间的转换建立为监督回归模型的训练问题。例如,可以通过图3中的步骤训练向量变换模型。
图3示出本公开的向量变换模型训练方法的一些实施例的流程图。
如图3所示,该方法包括:步骤1301,构建多个映射函数;步骤1302,训练多个映射函数。
在步骤1301中,构建多个映射函数,各映射函数分别能够将用户的社交特征向量映射为用户的购物特征向量中的各元素。例如,用户u的购物特征向量vu包含k个维度,构建一组回归函数第i个回归函数f(i)能够将用户u的社交特征向量au,映射为vu中的第i个特征值vu(i),即vu(i)=f(i)(au)。这样,将两个向量的变换模型分解为多个从向量到元素的映射函数,从而降低了实现难度,提高了实现效率。
在步骤1302中,训练多个映射函数作为向量变换模型。例如,可以采用GBDT(Gradient Boosting Decision Tree,梯度提升决策树)来训练上述多个映射函数,GBDT对训练输入和输出之间的高阶变换关系具有良好的性能。
通过步骤110-步骤130利用“连接用户”建立了购物特征和社交特征之间的关联,并获取了购物特征向量和社交特征向量之间的变换模型。下面就可以通过步骤140和步骤150以该变换模型为数据基础为新用户推荐物品,即在“冷启动”情况下实现物品推荐。
在步骤140中,根据目标用户的社交特征向量和向量变换模型,得到目标用户的购物特征向量。目标用户可以是从未在电子商务网站上购买过物品但是在社交网站上发表过文本的用户,即新用户。例如,可以按照上述任一个实施例中的方法获取目标用户的社交特征向量,然后将社交特征向量输入训练好的向量变换模型即可计算出该用户相应的购物特征向量。这样就可以在没有用户购物数据基础的情况下,估计该用户的购物偏好和习惯。
在步骤150中,根据目标用户的购物特征向量确定推荐物品。例如,可以通过图4中的步骤确定推荐物品。
图4示出本公开的推荐物品确定方法的一些实施例的流程图。
如图4所示,该方法包括:步骤1501,计算各物品的物品特征向量;步骤1502,计算向量相似度。
在步骤1501中,根据各用户的历史购物记录中的各物品ID,计算相应的词向量作为各物品的物品特征向量。例如,可以将历史购物记录中的每个物品ID视为一个单词标记,然后将历史购物记录转换为时间序列数据,最后获取时间序列数据中每个单词标记的词向量作为物品ID的物品特征向量。可以通过图5中的步骤来确定物品特征向量。
图5示出本公开的物品特征向量确定方法的一些实施例的流程图。
如图5所示,该方法包括:步骤15011,确定物品序列;步骤15012,确定目标物品ID的上下文;步骤15013,将物品序列输入item2vec模型。item2vec模型能够把一个项目的高维稀疏的表示方式映射到低维稠密的向量空间中,从而使用低维向量(物品特征向量)来表示物品ID。
在步骤15011中,按照历史购物记录中各物品的购买顺序,将物品ID组合为物品序列。例如,可以将物品序列中的每个物品ID视为一个词,将各用户的物品序列数据作为训练模型的输入语料。
在步骤15012中,将物品序列中与目标物品ID相邻的物品ID确定为目标物品ID的上下文。例如,可以将目标物品ID的上下文定义为围绕目标物品ID的大小为4的滑窗,滑窗可以包括购买目标物品之前购买的两个物品和之后购买的两个物品。这样,就可以通过用户购买物品的顺序来分析用户购买物品之间的关联,进而得到用户的购物偏好和特征。
在步骤15013中,将物品序列输入item2vec模型,以计算各物品相应的词向量作为物品特征向量。这样,就可以利用物品ID之间的上下文信息,在潜在特征空间中学习每个物品ID的固定长度的实数向量表示,并将特征相似的物品映射为相近的实数,而不是孤立地分析物品的特征。得到的物品特征向量可以用于物品聚类、物品推荐等。
通过步骤15011-步骤15013可以将物品特征映射到与之前获取的购物特征相同的向量空间中去,从而可以通过图4中的步骤1502比较二者的相似程度,实现物品推荐。
在步骤1502中,根据目标用户的购物特征向量与各物品的物品特征向量之间的相似度,确定推荐物品。例如,可以通过计算目标用户的购物特征向量与各物品的物品特征向量之间的夹角的余弦值确定相似度。
在一些实施例中,目标用户的购物特征向量vu为[vu(1),vu(2),…vu(n),…,vu(N)],某物品的物品特征向量为tu为[tu(1),tu(2),…tu(n),…,tu(N)],n和N为大于1的整数。向量vu与tu之间夹角θ的余弦值为:
上述实施例中,根据已经在电子商务网站过买过物品的用户的社交特征和购物特征训练变换模型,利用变换模型将未在电子商务网站购买过物品的用户的社交特征转换为购物特征。这样可以为电子商务网站的新用户推荐物品,从而增强了物品推荐的扩展性、扩大了适用范围。而且这样还可以自动分析用户的购物习惯,从而提高了物品推荐的准确率、降低了成本。
图6示出本公开的物品推荐装置的一些实施例的框图。
如图6所示,物品推荐装置6包括购物特征向量获取模块61、社交特征向量获取模块62、模型训练模块63、特征向量转换模块64和推荐物品确定模块65。
购物特征向量获取模块61根据各用户的历史购物记录,计算相应的句子向量作为各用户的购物特征向量。例如,购物特征向量获取模块61将历史购物记录中包含的物品ID和用户ID作为词标记,将历史购物记录作为输入句子输入para2vec模型以计算出所述历史购物记录相应的句子向量。para2vec模型的滑动上下文窗口可以始终包括用户ID。
社交特征向量获取模块62根据各用户的社交属性,生成各用户的社交特征向量。例如,社交属性可以包括人口统计特征、用户发表文本的语言特征和用户发表文本的时间分布中的至少一项。
模型训练模块63以各社交特征向量为输入,以各购物特征向量为输出,训练向量变换模型。例如,模型训练模块63可以构建多个映射函数,各映射函数分别能够将用户的社交特征向量映射为用户的购物特征向量中的各元素,然后训练多个映射函数作为向量变换模型。
特征向量转换模块64根据目标用户的社交特征向量和向量变换模型,得到目标用户的购物特征向量。推荐物品确定模块65根据目标用户的购物特征向量确定推荐物品。例如,推荐物品确定模块65可以根据各用户的历史购物记录中的各物品ID,计算相应的词向量作为各物品的物品特征向量,根据目标用户的购物特征向量与各物品的物品特征向量之间的相似度,确定所述推荐物品。
在一些实施例中,推荐物品确定模块65可以按照历史购物记录中各物品的购买顺序,将所有物品ID组合为物品序列。然后,将物品序列中与目标物品ID相邻的物品ID确定为所述目标物品ID的上下文,将所述物品序列输入item2vec模型,以计算各物品相应的词向量。例如,推荐物品确定模块65可以通过计算目标用户的购物特征向量与各物品的物品特征向量之间的夹角的余弦值确定相似度。
上述实施例中,根据已经在电子商务网站过买过物品的用户的社交特征和购物特征训练变换模型,利用变换模型将未在电子商务网站购买过物品的用户的社交特征转换为购物特征。这样可以为电子商务网站的新用户推荐物品,从而增强了物品推荐的扩展性、扩大了适用范围。而且这样还可以自动分析用户的购物习惯,从而提高了物品推荐的准确率、降低了成本。
图7示出本公开的物品推荐装置的又一些实施例的框图。
如图7所示,该实施例的物品信息处理装置7包括:存储器71和耦接至该存储器71的处理器72,处理器72被配置为基于存储在存储器71中的指令,执行本公开中任意一个实施例中的物品推荐方法。
存储器71例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。
本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
至此,已经详细描述了根据本公开的物品推荐方法、物品推荐装置和计算机可读存储介质。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改。本公开的范围由所附权利要求来限定。
Claims (16)
1.一种物品推荐方法,包括:
根据各用户的历史购物记录,计算相应的句子向量作为所述各用户的购物特征向量;
根据所述各用户的社交属性,生成所述各用户的社交特征向量;
以各所述社交特征向量为输入,以各所述购物特征向量为输出,训练向量变换模型;
根据目标用户的社交特征向量和所述向量变换模型,得到所述目标用户的购物特征向量;
根据所述目标用户的购物特征向量确定推荐物品。
2.根据权利要求1所述的物品推荐方法,其中,所述确定推荐物品包括:
根据所述各用户的历史购物记录中的各物品ID,计算相应的词向量作为所述各物品的物品特征向量;
根据所述目标用户的购物特征向量与所述各物品的物品特征向量之间的相似度,确定所述推荐物品。
3.根据权利要求1所述的物品推荐方法,其中,所述计算相应的句子向量包括:
将所述历史购物记录中包含的物品ID和用户ID作为词标记;
将所述历史购物记录作为输入句子输入para2vec模型,所述para2vec模型的滑动上下文窗口始终包括所述用户ID,以计算出所述历史购物记录相应的句子向量。
4.根据权利要求2所述的物品推荐方法,其中,所述计算相应的词向量包括:
按照所述历史购物记录中各物品的购买顺序,将所有物品ID组合为物品序列;
将所述物品序列中与目标物品ID相邻的物品ID确定为所述目标物品ID的上下文;
将所述物品序列输入item2vec模型,以计算各物品相应的词向量。
5.根据权利要求1所述的物品推荐方法,其中,
所述社交属性包括人口统计特征、用户发表文本的语言特征和用户发表文本的时间分布中的至少一项。
6.根据权利要求1所述的物品推荐方法,其中,所述训练向量变换模型包括:
构建多个映射函数,各所述映射函数分别能够将用户的社交特征向量映射为所述用户的购物特征向量中的各元素;
训练所述多个映射函数作为所述向量变换模型。
7.根据权利要求2所述的物品推荐方法,其中,
所述相似度为通过计算所述目标用户的购物特征向量与所述各物品的物品特征向量之间的夹角的余弦值确定。
8.一种物品推荐装置,包括:
购物特征向量获取模块,用于根据各用户的历史购物记录,计算相应的句子向量作为所述各用户的购物特征向量;
社交特征向量获取模块,用于根据所述各用户的社交属性,生成所述各用户的社交特征向量;
模型训练模块,用于以各所述社交特征向量为输入,以各所述购物特征向量为输出,训练向量变换模型;
特征向量转换模块,用于根据目标用户的社交特征向量和所述向量变换模型,得到所述目标用户的购物特征向量;
推荐物品确定模块,用于根据所述目标用户的购物特征向量确定推荐物品。
9.根据权利要求8所述的物品推荐装置,其中,
所述推荐物品确定模块根据所述各用户的历史购物记录中的各物品ID,计算相应的词向量作为所述各物品的物品特征向量,根据所述目标用户的购物特征向量与所述各物品的物品特征向量之间的相似度,确定所述推荐物品。
10.根据权利要求8所述的物品推荐装置,其中,
所述购物特征向量获取模块将所述历史购物记录中包含的物品ID和用户ID作为词标记,将所述历史购物记录作为输入句子输入para2vec模型,所述para2vec模型的滑动上下文窗口始终包括所述用户ID,以计算出所述历史购物记录相应的句子向量。
11.根据权利要求9所述的物品推荐装置,其中,
所述推荐物品确定模块按照所述历史购物记录中各物品的购买顺序,将所有物品ID组合为物品序列,将所述物品序列中与目标物品ID相邻的物品ID确定为所述目标物品ID的上下文,将所述物品序列输入item2vec模型,以计算各物品相应的词向量。
12.根据权利要求8所述的物品推荐装置,其中,
所述社交属性包括人口统计特征、用户发表文本的语言特征和用户发表文本的时间分布中的至少一项。
13.根据权利要求8所述的物品推荐装置,其中,
所述模型训练模块构建多个映射函数,各所述映射函数分别能够将用户的社交特征向量映射为所述用户的购物特征向量中的各元素,训练所述多个映射函数作为所述向量变换模型。
14.根据权利要求9所述的物品推荐装置,其中,
所述推荐物品确定模块通过计算所述目标用户的购物特征向量与所述各物品的物品特征向量之间的夹角的余弦值确定所述相似度。
15.一种物品推荐装置,包括:
存储器;和
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器装置中的指令,执行权利要求1-7任一项所述的物品推荐方法。
16.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-7任一项所述的物品推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810280221.7A CN110348919A (zh) | 2018-04-02 | 2018-04-02 | 物品推荐方法、装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810280221.7A CN110348919A (zh) | 2018-04-02 | 2018-04-02 | 物品推荐方法、装置和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110348919A true CN110348919A (zh) | 2019-10-18 |
Family
ID=68172382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810280221.7A Pending CN110348919A (zh) | 2018-04-02 | 2018-04-02 | 物品推荐方法、装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110348919A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112364937A (zh) * | 2020-11-30 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 用户类别确定方法及装置、推荐内容确定方法、电子设备 |
CN112579889A (zh) * | 2020-12-07 | 2021-03-30 | 北京百度网讯科技有限公司 | 物品推荐方法、装置、电子设备及存储介质 |
CN112836115A (zh) * | 2019-11-25 | 2021-05-25 | 浙江大搜车软件技术有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
CN113052647A (zh) * | 2019-12-27 | 2021-06-29 | 腾讯科技(深圳)有限公司 | 一种用于冷启动的推荐方法、装置及计算机可读存储介质 |
CN113393281A (zh) * | 2020-03-11 | 2021-09-14 | 北京沃东天骏信息技术有限公司 | 一种处理请求的方法和装置 |
CN113781143A (zh) * | 2020-11-05 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 对象推荐方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140244361A1 (en) * | 2013-02-25 | 2014-08-28 | Ebay Inc. | System and method of predicting purchase behaviors from social media |
CN107103499A (zh) * | 2017-04-26 | 2017-08-29 | 中国人民大学 | 一种基于深度学习的跨站点冷启动推荐方法 |
CN107341222A (zh) * | 2017-06-28 | 2017-11-10 | 清华大学 | 跨平台主题关联方法、装置及其设备 |
-
2018
- 2018-04-02 CN CN201810280221.7A patent/CN110348919A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140244361A1 (en) * | 2013-02-25 | 2014-08-28 | Ebay Inc. | System and method of predicting purchase behaviors from social media |
CN107103499A (zh) * | 2017-04-26 | 2017-08-29 | 中国人民大学 | 一种基于深度学习的跨站点冷启动推荐方法 |
CN107341222A (zh) * | 2017-06-28 | 2017-11-10 | 清华大学 | 跨平台主题关联方法、装置及其设备 |
Non-Patent Citations (1)
Title |
---|
WAYNE XIN ZHAO 等: "Connecting Social Media to E-Commerce: Cold-Start Product Recommendation Using Microblogging Information", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112836115A (zh) * | 2019-11-25 | 2021-05-25 | 浙江大搜车软件技术有限公司 | 信息推荐方法、装置、计算机设备和存储介质 |
CN113052647A (zh) * | 2019-12-27 | 2021-06-29 | 腾讯科技(深圳)有限公司 | 一种用于冷启动的推荐方法、装置及计算机可读存储介质 |
CN113052647B (zh) * | 2019-12-27 | 2024-04-09 | 腾讯科技(深圳)有限公司 | 一种用于冷启动的推荐方法、装置及计算机可读存储介质 |
CN113393281A (zh) * | 2020-03-11 | 2021-09-14 | 北京沃东天骏信息技术有限公司 | 一种处理请求的方法和装置 |
CN113781143A (zh) * | 2020-11-05 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 对象推荐方法及装置 |
CN113781143B (zh) * | 2020-11-05 | 2024-05-24 | 北京沃东天骏信息技术有限公司 | 对象推荐方法及装置 |
CN112364937A (zh) * | 2020-11-30 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 用户类别确定方法及装置、推荐内容确定方法、电子设备 |
CN112364937B (zh) * | 2020-11-30 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 用户类别确定方法及装置、推荐内容确定方法、电子设备 |
CN112579889A (zh) * | 2020-12-07 | 2021-03-30 | 北京百度网讯科技有限公司 | 物品推荐方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ong et al. | The measurement of user satisfaction with question answering systems | |
US20220147845A1 (en) | Generation of recommendation reason | |
CN110348919A (zh) | 物品推荐方法、装置和计算机可读存储介质 | |
Kennard et al. | Evaluating word embeddings using a representative suite of practical tasks | |
Zhang et al. | Daily-aware personalized recommendation based on feature-level time series analysis | |
Ghasemi et al. | Neural text similarity of user reviews for improving collaborative filtering recommender systems | |
Liu et al. | iLDA: An interactive latent Dirichlet allocation model to improve topic quality | |
Rafeh et al. | An adaptive approach to dealing with unstable behaviour of users in collaborative filtering systems | |
Shen et al. | A voice of the customer real-time strategy: An integrated quality function deployment approach | |
Gao et al. | Preference-based interactive multi-document summarisation | |
WO2016114790A1 (en) | Reading difficulty level based resource recommendation | |
Bilal et al. | Profiling users’ behavior, and identifying important features of review “helpfulness” | |
Tayal et al. | Personalized ranking of products using aspect-based sentiment analysis and Plithogenic sets | |
Wang et al. | Research on hybrid collaborative filtering recommendation algorithm based on the time effect and sentiment analysis | |
Zhang et al. | DSGPT: Domain-specific generative pre-training of transformers for text generation in e-commerce title and review summarization | |
Shi et al. | Definition of customer requirements in big data using word vectors and affinity propagation clustering | |
Ding et al. | TDTMF: a recommendation model based on user temporal interest drift and latent review topic evolution with regularization factor | |
Wei et al. | Embedding electronic health records for clinical information retrieval | |
CN110020195B (zh) | 文章推荐方法及装置、存储介质、电子设备 | |
Nunes et al. | Chronic pain and language: A topic modelling approach to personal pain descriptions | |
Fabbri et al. | Multi-perspective abstractive answer summarization | |
Bandyopadhyay et al. | Identification of depression strength for users of online platforms: a comparison of text retrieval approaches | |
Guo et al. | Contextual Collaborative Filtering Recommendation Model Integrated with Drift Characteristics of User Interest | |
Xiao et al. | A personality-aware followee recommendation model based on text semantics and sentiment analysis | |
Yang et al. | Detecting Signs of Depression for Using Chatbots–Extraction of the First Person from Japanese |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20191018 |