CN109191240B - 一种进行商品推荐的方法和装置 - Google Patents

一种进行商品推荐的方法和装置 Download PDF

Info

Publication number
CN109191240B
CN109191240B CN201810922308.XA CN201810922308A CN109191240B CN 109191240 B CN109191240 B CN 109191240B CN 201810922308 A CN201810922308 A CN 201810922308A CN 109191240 B CN109191240 B CN 109191240B
Authority
CN
China
Prior art keywords
commodity
user
browsing
similarity
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810922308.XA
Other languages
English (en)
Other versions
CN109191240A (zh
Inventor
韩亮
翁谦
张博宣
刘玉明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiuhu Times Intelligent Technology Co ltd
Original Assignee
Beijing Jiuhu Times Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiuhu Times Intelligent Technology Co ltd filed Critical Beijing Jiuhu Times Intelligent Technology Co ltd
Priority to CN201810922308.XA priority Critical patent/CN109191240B/zh
Publication of CN109191240A publication Critical patent/CN109191240A/zh
Application granted granted Critical
Publication of CN109191240B publication Critical patent/CN109191240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Abstract

本申请提供了一种进行商品推荐的方法和装置,其中,该方法包括:获取用户对电子商品进行行为操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;根据用户的商品购买数据,以确定不同用户之间的用户相似度;根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品。本申请实施例通过相似度预测模型为用户推荐用户可能感兴趣的商品,节约了用户的浏览时间并为用户提供较为精准的个性化商品推荐。

Description

一种进行商品推荐的方法和装置
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种进行商品推荐的方法和装置。
背景技术
近年来,随着电子商务规模的不断扩大,商品个数和种类快速增长,用户在挑选商品时,通常需要从大量的无关的商品中,花费大量的时间才能筛选出自己想要购买的商品,使得用户的使用体验下降。
为了解决以上问题,电子商务推荐系统应运而生。目前互联网上的电子商务推荐系统,一般是基于商品销售排行、用户对商品的评价评分进行商品推荐。
发明内容
有鉴于此,本申请的目的在于提供一种进行商品推荐的方法和装置,以为用户提供较为精准的个性化商品推荐,以节约用户浏览不相关商品所耗费的时间。
第一方面,本申请实施例提供了一种进行商品推荐的方法,其特征在于,包括:
获取用户对电子商品进行行为操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;
将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;
根据用户的商品购买数据,确定不同用户之间的用户相似度;
根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述用户行为数据包括用户对商品的点击次数数据、用户对商品的购买次数数据、用户对商品的收藏次数数据、用户将商品加购物车的行为数据和用户对商品的用户浏览行为数据;
步骤根据用户行为数据确定用户对电子商品的商品关注度,包括:
按照预设的权重值,对不同的所述用户行为数据进行加权计算,以确定用户对电子商品的商品关注度。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,步骤将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度,包括:
将所述用户浏览行为数据输入到第一预测模型,以生成表征用户对商品进行浏览的次序的商品浏览轨迹向量;
根据所述用户浏览行为数据得到属性浏览轨迹样本,并将所述属性浏览轨迹样本输入到第二预测模型,以生成商品属性向量;所述商品属性向量用于表征相同商品属性所对应的不同商品之间的关联性。
将所述商品浏览轨迹向量和所述商品属性向量输入到池化层,以确定不同商品之间的商品相似度。
结合第一方面的第二种可能的实施方式,本申请实施例提供了第一方面的第三种可能的实施方式,其中,步骤将所述用户浏览行为数据输入到第一预测模型,以生成表征用户对商品进行浏览的次序的商品浏览轨迹向量,包括:
根据所述用户浏览行为数据,生成无向图结构;无向图结构用于表征用户按照每一种浏览顺序对商品进行浏览后的商品之间的浏览的关联性;
采用随机游走的方式,从所述无向图结构中提取商品浏览轨迹样本;所述商品浏览轨迹样本用于表征用户可能采用的商品浏览轨迹,或用户不可能采用的商品浏览轨迹;
将商品浏览轨迹样本输入第一预测模型,以生成表征用户对商品进行浏览的浏览次序的商品浏览轨迹向量。
结合第一方面的第三种可能的实施方式,本申请实施例提供了第一方面的第四种可能的实施方式,其中,步骤根据所述用户浏览行为数据得到属性浏览轨迹样本,并将所述属性浏览轨迹样本输入到第二预测模型,以生成商品属性向量,包括:
使用商品属性分别对商品浏览轨迹样本中每个商品的识别标识进行替换,以生成属性浏览轨迹样本;
分别将多个属性浏览轨迹样本输入到第二预测模型,以生成表征商品属性关联特征的各个商品属性子向量;所述商品属性包括库存量单位、标准化产品单元、产品名称、产品分类和产品品种。
将所述各个商品属性子向量输入池化层,以生成表征商品属性关联特征的商品属性向量。
结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,根据用户的商品购买数据,确定不同用户之间的用户相似度,包括:
将用户的商品购买数据输入到协同过滤算法模型,以确定不同用户之间的用户相似度;所述商品购买数据包括用户的用户属性数据;所述用户属性数据包括年龄、性别、学历、籍贯。
结合第一方面,本申请实施例提供了第一方面的第六种可能的实施方式,其中,根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品,包括:
采用加权计算的方式,根据所述商品关注度、商品相似度值和用户相似度值,计算每个候选电子商品的推荐值;
按照推荐值的大小,从候选电子商品的推荐值中确定向用户进行推荐的商品。
结合第一方面,本申请实施例提供了第一方面的第七种可能的实施式,其中,所述相似度预测模型是word2vec模型。
第二方面,本申请实施例还提供了一种进行商品推荐的装置,其特征在于,包括:
第一数据生成模块,用于获取用户对电子商品进行操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;
第二数据生成模块,用于将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;
第三数据生成模块,用于根据用户的商品购买数据,以确定不同用户之间的用户相似度;
数据处理模块,用于根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品。
结合第三方面,本申请实施例还提供了一种一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当网络侧设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时,执行如第一方面中任一项所述的方法。
本申请实施例提供的一种进行商品推荐的方法,通过获取用户对电子商品进行操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;根据用户的商品购买数据,以确定不同用户之间的用户相似度;根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品。在该方法中,同时考虑到商品关注度、商品相似度和用户相似度这三个方面的要素,并最终确定推荐的商品,为用户提供了相对更加个性化并且较为精准的商品推荐信息,且可有效地帮助用户节省因浏览大量无关商品而耗费的时间。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种进行商品推荐的方法的流程图;
图2示出了本申请实施例所提供的一种进行商品推荐的优化方法的流程图;
图3示出了本申请实施例所提供的另一种进行商品推荐的优化方法的流程图;
图4示出了本申请实施例所提供的另一种进行商品推荐的优化方法的示意图;
图5示出了本申请实施例所提供的一种进行商品推荐的装置的结构示意图;
图6示出了本申请实施例所提供的一种进行商品推荐的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品的过程,无疑会使淹没在信息过载问题中的消费者不断流失。
因上述问题,商品推荐系统应运而生。商品推荐系统是利用电子商务网站向客户提供商品信息和建议的系统。商品推荐系统可以帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。而商品推荐系统中的个性化推荐是根据用户平时在浏览商品时对商品的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。
基于此,本申请实施例提供了一种商品推荐方法和装置,如图1所示,包含以下步骤:
S101,获取用户对电子商品进行行为操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;
S102,将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;
S103,根据用户的商品购买数据,确定不同用户之间的用户相似度;
S104,根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品。
步骤S101中,用户在浏览商品的同时会对所浏览的商品有一系列的操作行为,比如在网页上对商品进行浏览,使用鼠标点击商品图标,以对商品进行点击进行详细查看,对商品进行收藏,将商品加入购物车,对商品进行购买,对商品进行评论,将商品链接进行转发或者推荐等。用户在对电子商品进行操作的行为而产生的数据即为用户行为数据,根据用户行为数据可以确定用户对商品的商品关注度。商品关注度就是用户对该商品的关注热度。商品关注度表征的是用户在对电子商品操作的过程中,对每一种商品的关注程度。用户的用户行为数据与用户对商品的关注程度是相关的,如用户对商品进行购买的次数越多,则表示用户对该商品的关注度很高,若将商品进行收藏则表示用户对商品的关注度一般。根据用户对商品的各种操作行为,可以根据各种用户行为数据对应的对商品的关注度程度,人为地为各种用户行为数据设定权重,并最终得到用户对商品的商品关注度。
步骤S102中,用户浏览数据可以从用户行为数据中获得,或者在用户浏览商品时获得。用户浏览数据指的是用户在浏览包含电子商品的网页时的浏览轨迹。相似度预测模型可以是Word2vec模型,即词向量模型。通过将用户浏览数据输入到相似度预测模型,可以得到用户所浏览的各种商品之间的相似性。用户在浏览网页上的商品时,当在某个页面停留的时间越长,则表示页面内容对用户的吸引力越高。当用户在浏览的过程中,在某一页面停留的时间较长,而在后来持续的浏览中如果继续出现在某一页面停留时间较长的情况,则可以认为两个页面上显示的商品之间是有联系的,都是用户感兴趣的商品。
在步骤S103中,用户相似度主要是通过不同用户的购买记录来生成的。当两个不同的用户均购买过同一款商品时,可以认为该两位不同的客户之间具有关联性。当多个用户均购买过同一个商品时,可以认为多个用户针对该商品具有相似性。确定用户相似度主要是通过协同过滤算法来进行计算的。基于用户的协同过滤推荐算法是指找到与目标用户U最为相似的K个用户,其中根据目标用户U的商品购买数据,计算所有用户与目标用户U之间的用户相似度,K个相似用户的用户之间的相似度的计算主要可以通过Jaccard公式和余弦相似度公式得到。然后将K个相似用户的行为商品进行整理聚合,按频次进行排序,放入待推荐列表中。以此来确定不同用户之间的用户相似性。
步骤S104中,将上述步骤中得到的商品关注度、商品相似度和用户相似度,通过加权的方式得出最后向用户推荐的商品。
步骤S101中,得到的商品关注度可以是对用户行为数据分别加权的结果。用户行为包括对商品进行浏览,对商品进行点击进行详细查看,对商品进行收藏,将商品加入购物车,对商品进行购买,对商品进行评论,将商品链接进行转发或者推荐等。用户行为数据是指因上述用户行为而得到的数据,如对同样商品收藏的次数,加购物车的次数,评论的次数,购买的次数,收藏的次数等。用户行为数据中包含着用户对商品的感兴趣程度,对这些数据进行加权计算,可以得出用户对该商品的关注度。其中,对用户行为数据进行加权,依照的是预设的权重。该权重值可以是人为设定的,即可人为根据用户行为数据的重要性程度依次设定权重。按照预设的权重值,对不同的所述用户行为数据进行加权计算,以确定用户对电子商品的商品关注度。
其中,步骤S102包括以下步骤,如图2所示:
S201,将所述用户浏览行为数据输入到第一预测模型,以生成表征用户对商品进行浏览的次序的商品浏览轨迹向量;
S202,根据所述用户浏览行为数据得到属性浏览轨迹样本,并将所述属性浏览轨迹样本输入到第二预测模型,以生成商品属性向量;所述商品属性向量用于表征相同商品属性所对应的不同商品之间的关联性;
S203,将所述商品浏览轨迹向量和所述商品属性向量输入到池化层,以确定不同商品之间的商品相似度。
其中,步骤S201中,首先获取用户的浏览行为数据。通过在电子商城网页上埋点的方式进行流量分析和页面统计。通过埋点的方式可以监控用户在某个页面停留的时长,表示用户正在持续的进行阅读,停留的时间越长,表示内容对用户的吸引力越高,这样才能产生持续的阅读行为。第一预测模型即为相似度预测模型,即将Word2vec模型训练为预测用户浏览行为数据之间关联性的第一预测模型,以生成用户对商品进行浏览的次序的商品浏览轨迹向量,商品轨迹向量表征的是用户对商品进行浏览的次序。
步骤S202中,根据用户浏览行为数据生成了商品浏览轨迹样本,商品浏览轨迹样本中是以商品的ID字符串作为唯一标识,将商品的ID字符串替换为商品的商品属性,以生成商品的属性浏览轨迹样本。并将相似度预测模型训练为预测商品属性之间关联性的第二预测模型。将商品的属性浏览轨迹样本输入到第二预测模型,生成商品属性向量,商品属性向量用于表征相同商品属性所对应的不同商品之间的关联性。
步骤S203中,将商品浏览轨迹向量和商品属性向量输入到池化层,池化层保留基本的特征,同时减少参数和计算量,防止过度拟合,最后得到不同商品之间的商品相似度。
如图3所示,是对步骤S201的细化,其中包括:
S301,根据所述用户浏览行为数据,生成无向图结构;无向图结构用于表征用户按照每一种浏览顺序对商品进行浏览后的商品之间的浏览的关联性;
S302,采用随机游走的方式,从所述无向图结构中提取商品浏览轨迹样本;所述商品浏览轨迹样本用于表征用户可能采用的商品浏览轨迹,或用户不可能采用的商品浏览轨迹;
S303,将商品浏览轨迹样本输入第一预测模型,以生成表征用户对商品浏览轨迹的商品浏览轨迹向量。
其中,步骤S301中,将用户浏览行为数据通过图建构算法转换成无向图结构,即Item Graph。用户浏览行为数据是用户在浏览电子商品时的浏览轨迹,这些浏览轨迹通过商品埋点的方式收集。用户的商品浏览轨迹是用户在浏览电子商品时的次序,将这些商品的次序通过唯一标识商品的商品ID字符串表示,即用户浏览行为数据是用户浏览的商品的ID字符串的排列顺序。通过图建构算法得到的无向图结构可以表现出各个商品之间的关联性。
其后,对步骤S301中得到的无向图结构采取随机游走的方式,即Random Walk方法。采取随机游走算法可以得到商品浏览轨迹样本,这里的商品轨迹样本包含用户可能浏览的商品次序,也包含用户可能并没有可能浏览的商品次序。采用随机游走的方式,可以获得更多的浏览记录采样,以丰富样本的多样性。
最后,如步骤S303,将得到的商品浏览轨迹样本输入到第一预测模型,即输入到Word2vec模型中。利用深度学习中的Word2vec模型进行商品表征,从而获得商品浏览轨迹向量。用户的商品浏览轨迹向量之间包含着商品之间的关联性。利用Word2vec生成的商品浏览轨迹向量,即为item2vec。
如图4所示,步骤S202包括以下步骤:
S401,使用商品属性分别对商品浏览轨迹样本中每个商品的识别标识进行替换,以生成属性浏览轨迹样本;
S402,分别将多个属性浏览轨迹样本输入到第二预测模型,以生成表征商品属性关联特征的各个商品属性子向量;所述商品属性包括库存量单位、标准化产品单元、产品名称、产品分类和产品品种;
S403,将所述各个商品属性子向量输入池化层,以生成表征商品属性关联特征的商品属性向量。
其中,用户的商品浏览记录只能保留用户对商品的局部关联特征,即用户对商品在浏览时产生的关联性,而商品自身的属性对于商品的表征也具有重要的作用。所以,在步骤S401中,将商品浏览轨迹样本中的商品ID序列号替换为商品属性,这时就生成了商品的属性浏览轨迹样本。商品属性包括但不限于以下:库存量单位、标准化产品单元、产品名称、产品分类和产品品种。每一种商品属性都对应生成一种商品的属性浏览轨迹样本,即有多少种商品属性,则对应生成多少种属性浏览轨迹样本。
其次,在步骤S402中,将在步骤S401中得到的多种属性浏览轨迹样本分别输入到第二预测模型,即word2vec模型中,并生成表征商品属性关联特征的各个商品属性子向量,即property2vec。
最后,如步骤S403,将各个商品属性子向量经过池化融合,得到多维度的商品属性向量properties2vec。
综上所述,将获取的用户浏览数据输入相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度的过程具体如下:
首先通过商城埋点等手段,收集用户因浏览商城的电子商品而产生的商品浏览轨迹,而形成用户的商品浏览行为数据。用户的商品浏览轨迹数据代表了用户的喜好偏好以及购买商品的意图,同时也会暗示多种商品间的关联特性,所以需要通过相关算法挖掘商品间的相关信息。比如可以通过图建构算法的深入挖掘,可以得到表示商品相关性的图结构Item Graph,然后利用Random Walk方法获得更多的商品轨迹浏览样本,以丰富样本的多样性,利用相关网络采样提高相关商品的共现性,接着利用深度学习算法中的Word2vec进行商品特征向量表征,从而获得商品浏览轨迹向量,即Item2vec。Word2vec模型是可用来映射每个元素到一个向量的神经网络模型,常用来表示词对词之间的关系,目前更多应用于具有序列特征元素提取元素表征向量,该向量为神经网络之隐藏层,这里使用的Word2vec模型包含Input Layer、Hidden Layer和Output Layer,即输入层、隐含层和输出层。
商品浏览行为数据只能保留用户对商品的局部关联特征,而商品自身的属性对表征商品同样具有重要的作用,所以在获得Item Graph后,通过将商品的ID字符串替换为其各种属性,以获得商品属性向量。然后通过深度学习计算,获得各个属性特征关联性的向量表示Property2vec,即商品属性子向量。然后将商品属性子向量输入池化层,以获得商品属性向量,即Properties2vec。将多维度的属性特征Properties2vec与Item2vec,进行pooling融合,从而获得信息量更加丰富的商品向量表示,以获得更准确的不同商品之间的商品相似度。
进一步的,步骤S103包括:
将用户的商品购买数据输入到协同过滤算法模型,以确定不同用户之间的用户相似度;所述商品购买数据包括用户的用户属性数据;所述用户属性数据包括年龄、性别、学历、籍贯。用户的商品购买数据可以推断出用户对商品的感兴趣程度。当两个用户同时购买过同一样商品,则可以推断该两位用户有一定的相似性。输入用户的商品购买数据是一并输入用户的用户属性数据,用户的属性数据可以从用户在商品网站的注册信息中得到,包括且不限于年龄、性别、学历、籍贯等。首先找到和目标用户相似的用户集合,如寻找与目标用户U最为相似的K个用户,由K个用户组成的即为用户集合;将用户集合中的用户购买过但目标用户U没有购买过的商品推荐给目标用户U。这里,确定与目标用户U最为相似的K个用户的用户集合主要是利用协同过滤算法。协同过滤算法主要利用行为的相似度计算用户之间的用户相似度。例如,给定用户u和用户v,令N(u)表示用户u行为商品集合,令N(v)为用户v行为商品集合。可以通过公式1,即Jaccard公式计算u和v的用户相似度:
Figure BDA0001764539280000131
通过公式2,即余弦相似度算法也可以计算u和v的用户相似度:
Figure BDA0001764539280000132
确定了与目标用户U相似的K个相似用户的用户相似度后,将K个用户购买过的商品但目标用户U未购买过得商品进行整合,并按频次进行排序,形成待推荐的用户相似度的列表。这里确定用户相似度的方式不限于协同过滤算法。
进一步的,步骤104包括:
将所述商品相似度输入第一计算模型,以确定商品相似度值。其中,商品相似度为一个矩阵向量,将该矩阵向量进行分解,以得到商品相似度值。第一计算模型可以是奇异值分解算法,也可以是余弦相似性算法等。将最后得到的商品关注度、商品相似度和用户相似度值经过动态加权的方式,可以人为的设置权重,比如将商品相似度的权重设置的较高,以此计算每个候选电子商品的推荐值,按照推荐值的大小,从候选电子商品的推荐值中,确定最后要向用户推荐的商品。最后向用户推荐的商品可以是商品之间都具有一定的相似度的商品列表。
下面以一个具体的实例来说明本申请所提供的方法,该实施例包括如下步骤:
步骤1,获取用户行为数据;用户行为数据可以是以下数据中的一种或多种:用户对商品的点击次数数据、用户对商品的购买次数数据、用户对商品的收藏次数数据、用户将商品加购物车的行为数据和用户对商品的用户浏览行为数据。
步骤2,对每种用户行为数据人为的设定权重;如对用户对商品的购买次数数据设定较高的权重0.4,对用户将商品加购物车的行为数据设定权重0.3,分别对用户对商品的点击次数数据、用户对商品的收藏次数数据和用户对商品的用户浏览行为数据设定0.15/0.15和0.1的权重。
步骤3,将步骤2中的用户行为数据进行加权计算,以获得用户对电子商品的商品关注度;商品关注度可以是以商品列表形式排列,即加权后分数越高则排在列表最前面。
步骤4,通过在用户浏览的网页埋点的方式获取用户的用户浏览行为数据。
步骤5,对用户浏览行为数据进行图建构算法的计算,以得到表示商品相关性的无向图结构Item Graph。
步骤6,对得到的无向图结构进行Random Walk方式的运算,以获得更多的商品轨迹浏览样本。
步骤7,利用深度学习算法中的word2vec模型进行商品表征,从而获得商品浏览轨迹向量,即item2vec。
步骤8,在获得Item Graph后,通过将商品的ID字符串替换为商品的各种属性,以获得商品的属性轨迹浏览样本。
步骤9,将属性浏览轨迹样本输入word2vec模型,获得各个属性特征关联性的向量表示property2vec,即商品属性子向量。
步骤10,将商品属性子向量输入池化层,以获得商品属性向量,即properties2vec。
步骤11,将多维度的属性特征properties2vec与步骤7得到的item2vec一起输入到池化层,以进行pooling融合,从而确定不同商品之间的商品相似度。
步骤12,获取用户的购买数据,利用相似度计算算法,确定不同用户之间的用户相似度。用户购买数据中还包括用户属性数据,如性别、年龄、学历和籍贯等。
步骤13,将前述步骤中所获得的商品关注度、商品相似度和用户相似度均采用加权计算的方式,计算每个候选的电子商品的推荐值。其中,各个参数的权重仍然是由人为得方式来设定,如可以将商品相似度的权重设置的较高。最后,按照推荐值得大小,从候选电子商品的推荐值中确定向用户进行推荐的商品。
与上述方法相对应的,如图5所示,本申请还提供一种进行商品推荐的装置,包括:
第一数据生成模块501,用于获取用户对电子商品进行操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;
第二数据生成模块502,用于将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;
第三数据生成模块503,用于根据用户的商品购买数据,以确定不同用户之间的用户相似度;
数据处理模块504,用于根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品。
进一步的,第一数据生成模块501包括第一数据计算单元,所述第一数据计算单元用于按照预设的权重值,对不同的所述用户行为数据进行加权计算,以确定用户对电子商品的商品关注度。
进一步的,第二数据生成模块502包括第二数据计算单元、第三数据计算单元、第一数据分析单元和第二数据分析单元;所述第二数据计算单元用于根据所述用户浏览行为数据得到属性浏览轨迹样本,并将所述属性浏览轨迹样本输入到第二预测模型,以生成商品属性向量;所述第三数据计算单元用于将多个属性浏览轨迹样本输入到第二预测模型,以生成表征商品属性关联特征的各个商品属性子向量;所述第一数据分析单元用于将所述各个商品属性子向量输入池化层,以生成表征商品属性关联特征的商品属性向量;所述第二数据分析单元用于将所述商品浏览轨迹向量和所述商品属性向量输入到池化层,以确定不同商品之间的商品相似度。
进一步的,第三数据生成模块503包括第四数据计算单元;所述第四数据单元用于将用户的商品购买数据输入到第一计算模型,以确定不同用户之间的用户相似度;所述商品购买数据包括用户的用户属性数据。
进一步的,数据处理模块504包括第一数据处理单元第二数据处理单元;所述第一数据处理单元用于采用加权计算的方式,根据所述商品关注度、商品相似度值和用户相似度值,计算每个候选电子商品的推荐值;所述第二数据处理单元用于按照推荐值的大小,从候选电子商品的推荐值中确定向用户进行推荐的商品。
本申请实施例还提供了一种非暂态性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的进行商品推荐的方法。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述进行商品推荐的方法,从而解决因浏览大量无关的信息和产品的过程,无疑会使淹没在信息过载问题中的消费者不断流失的问题。
如图6所示,为本申请实施例所提供的计算设备示意图,该计算设备60包括:处理器61、存储器62和总线63,存储器62存储有执行指令,当计算设备运行时,处理器61与存储器62之间通过总线63通信,处理器61执行存储器62中存储的如进行商品推荐方法的步骤。
综上所述,本申请的一个目的是通过融合多种商品推荐方法,增强推荐的多样性以及差异性,解决冷启动问题,通过离线、在线等多途径计算优化推荐效果和效率。同时推荐系统具有强解释性。推荐算法将传统的机器学习算法和最新的深度学习技术相融合,构建可信度更好的商品以及用户特征表示。本申请利用预先训练好的相似度模型确定用户在浏览商品时的商品相似度,并确定用户相似度和商品关注度,并根据商品关注度、商品相似度和用户相似度一起确定最终给用户推荐的商品。根据用户的浏览习惯和浏览的商品之间的关联性,通过深度学习训练出商品的嵌入向量表示,同时利用多种特征向量组合,保证特征可以高度涵盖商品属性信息以及用户偏好信息,以确定最终的推荐商品。
在本申请中,商品推荐方法主要包括四个步骤,分别是确定商品关注度、商品相似度和用户相似度,即加权热门推荐、相似商品推荐、相似用户推荐,系统最终将以动态加权方式进行推荐商品排序展示给用户。其中,算法内的商品特征表示不再像以往以OneHot编码表示,而是通过深度学习训练出商品嵌入向量表示,同时利用多种特征向量组合,以保证特征可以高度涵盖商品属性信息以及用户偏好信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (8)

1.一种进行商品推荐的方法,其特征在于,包括:
获取用户对电子商品进行行为操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;
将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;
根据用户的商品购买数据,确定不同用户之间的用户相似度;
根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品;
将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度,包括:
将所述用户浏览行为数据输入到第一预测模型,以生成表征用户对商品进行浏览的次序的商品浏览轨迹向量;
根据所述用户浏览行为数据得到属性浏览轨迹样本,并将所述属性浏览轨迹样本输入到第二预测模型,以生成商品属性向量;所述商品属性向量用于表征相同商品属性所对应的不同商品之间的关联性;
将所述商品浏览轨迹向量和所述商品属性向量输入到池化层,以确定不同商品之间的商品相似度;
步骤将所述用户浏览行为数据输入到第一预测模型,以生成表征用户对商品进行浏览的次序的商品浏览轨迹向量,包括:
根据所述用户浏览行为数据,生成无向图结构;所述无向图结构用于表征用户按照每一种浏览顺序对商品进行浏览后的商品之间的浏览的关联性;
采用随机游走的方式,从所述无向图结构中提取商品浏览轨迹样本;所述商品浏览轨迹样本用于表征用户可能采用的商品浏览轨迹;
将商品浏览轨迹样本输入第一预测模型,以生成表征用户对商品进行浏览的浏览次序的商品浏览轨迹向量。
2.根据权利要求1所述的方法,其特征在于,所述用户行为数据至少包括用户对商品的点击次数数据、用户对商品的购买次数数据、用户对商品的收藏次数数据、用户将商品加购物车的行为数据和用户对商品的用户浏览行为数据;
根据用户行为数据确定用户对电子商品的商品关注度,包括:
按照预设的权重值,对不同的所述用户行为数据进行加权计算,以确定用户对电子商品的商品关注度。
3.根据权利要求1所述的方法,步骤根据所述用户浏览行为数据得到属性浏览轨迹样本,并将所述属性浏览轨迹样本输入到第二预测模型,以生成商品属性向量,包括:
使用商品属性分别对商品浏览轨迹样本中每个商品的识别标识进行替换,以生成属性浏览轨迹样本;
分别将多个属性浏览轨迹样本输入到第二预测模型,以生成表征商品属性关联特征的各个商品属性子向量;
将所述各个商品属性子向量输入池化层,以生成表征商品属性关联特征的商品属性向量。
4.根据权利要求3所述的方法,其特征在于,包括:
所述商品属性包括库存量单位、标准化产品单元、产品名称、产品分类和产品品种。
5.根据权利要求1所述的方法,其特征在于,根据用户的商品购买数据,确定不同用户之间的用户相似度,包括:
将用户的商品购买数据输入到协同过滤算法模型,以确定不同用户之间的用户相似度;所述商品购买数据包括用户的用户属性数据;所述用户属性数据包括年龄、性别、学历和籍贯。
6.根据权利要求1所述的方法,其特征在于,根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品,包括:
采用加权计算的方式,根据所述商品关注度、商品相似度值和用户相似度值,计算每个候选电子商品的推荐值;
按照推荐值的大小,从候选电子商品的推荐值中确定向用户进行推荐的商品。
7.一种进行商品推荐的装置,其特征在于,包括:
第一数据生成模块,用于获取用户对电子商品进行操作而产生的用户行为数据,并根据用户行为数据确定用户对电子商品的商品关注度;
第二数据生成模块,用于将获取到的用户浏览行为数据输入到相似度预测模型,以获取相似度预测模型所输出的不同商品之间的商品相似度;
第三数据生成模块,用于根据用户的商品购买数据,以确定不同用户之间的用户相似度;
数据处理模块,用于根据所述商品关注度、商品相似度和用户相似度,确定向用户进行推荐的商品;
所述第二数据生成模块,具体用于将所述用户浏览行为数据输入到第一预测模型,以生成表征用户对商品进行浏览的次序的商品浏览轨迹向量;
根据所述用户浏览行为数据得到属性浏览轨迹样本,并将所述属性浏览轨迹样本输入到第二预测模型,以生成商品属性向量;所述商品属性向量用于表征相同商品属性所对应的不同商品之间的关联性;
将所述商品浏览轨迹向量和所述商品属性向量输入到池化层,以确定不同商品之间的商品相似度;
所述第二数据生成模块,具体用于根据所述用户浏览行为数据,生成无向图结构;所述无向图结构用于表征用户按照每一种浏览顺序对商品进行浏览后的商品之间的浏览的关联性;
采用随机游走的方式,从所述无向图结构中提取商品浏览轨迹样本;所述商品浏览轨迹样本用于表征用户可能采用的商品浏览轨迹;
将商品浏览轨迹样本输入第一预测模型,以生成表征用户对商品进行浏览的浏览次序的商品浏览轨迹向量。
8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时,执行权利要求1至6任一项所述的方法。
CN201810922308.XA 2018-08-14 2018-08-14 一种进行商品推荐的方法和装置 Active CN109191240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810922308.XA CN109191240B (zh) 2018-08-14 2018-08-14 一种进行商品推荐的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810922308.XA CN109191240B (zh) 2018-08-14 2018-08-14 一种进行商品推荐的方法和装置

Publications (2)

Publication Number Publication Date
CN109191240A CN109191240A (zh) 2019-01-11
CN109191240B true CN109191240B (zh) 2021-06-08

Family

ID=64921493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810922308.XA Active CN109191240B (zh) 2018-08-14 2018-08-14 一种进行商品推荐的方法和装置

Country Status (1)

Country Link
CN (1) CN109191240B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110070397B (zh) * 2019-04-24 2021-08-20 厦门美图之家科技有限公司 广告定向方法及电子设备
CN111026966B (zh) * 2019-12-06 2023-12-22 创新奇智(成都)科技有限公司 基于用户和产品画像及两者关联程度的搜索推荐排序方法
CN111259222B (zh) * 2020-01-22 2023-08-22 北京百度网讯科技有限公司 物品推荐方法、系统、电子设备及存储介质
CN113449200B (zh) * 2020-03-26 2023-04-18 杭州海康威视数字技术股份有限公司 物品推荐方法、装置及计算机存储介质
CN111585803A (zh) * 2020-04-29 2020-08-25 北京金山云网络技术有限公司 一种配置信息的填写方法、装置、电子设备及存储介质
CN111652648A (zh) * 2020-06-03 2020-09-11 陈包容 智能生成个性化组合促销方案的方法及具有该方法的系统
CN111612551A (zh) * 2020-06-03 2020-09-01 陈包容 商家进行用户数据引流的方法及系统
CN111695042B (zh) * 2020-06-10 2023-04-18 湖南湖大金科科技发展有限公司 基于深度游走和集成学习的用户行为预测方法及系统
CN112435102A (zh) * 2020-12-15 2021-03-02 中国联合网络通信集团有限公司 商品相似度计算方法及装置,和商品推荐方法及系统
CN112633973A (zh) * 2020-12-18 2021-04-09 平安科技(深圳)有限公司 一种商品推荐方法及其相关设备
CN112785372B (zh) * 2021-01-11 2023-09-12 北京欧拉认知智能科技有限公司 一种基于语义关系的智能推荐方法
CN112925993B (zh) * 2021-04-08 2022-02-08 国网电子商务有限公司 一种协同过滤推荐方法、装置、存储介质和设备
CN113392325A (zh) * 2021-06-21 2021-09-14 电子科技大学 一种基于深度学习的信息推荐方法
CN113496432A (zh) * 2021-07-06 2021-10-12 北京爱笔科技有限公司 待推荐实体的挖掘方法、装置、设备及存储介质
CN113628004A (zh) * 2021-07-29 2021-11-09 陈子龙 终端显示设备图像显示方法
CN113781158A (zh) * 2021-08-23 2021-12-10 湖南大学 商品组合的推荐方法、装置及存储介质
TWI826881B (zh) * 2021-12-22 2023-12-21 阿物科技股份有限公司 喚醒未購物消費者之系統及其實施方法
CN114969249B (zh) * 2022-04-28 2022-12-20 江苏四象软件有限公司 数据挖掘系统及数据挖掘方法
CN115375414B (zh) * 2022-10-25 2023-04-07 湖南有态度网络科技有限公司 一种基于大数据的社区团购商品推荐方法、装置、电子设备及储存介质
CN115392406B (zh) * 2022-10-28 2023-04-28 山东智豆数字科技有限公司 一种基于历史交易信息的用户分类管理方法
CN115953215B (zh) * 2022-12-01 2023-09-05 上海交通大学 一种基于时间和图结构的搜索式推荐方法
CN116503126A (zh) * 2023-03-22 2023-07-28 中国船舶集团有限公司综合技术经济研究院 一种产品推荐方法、装置、电子设备及可读存储介质
CN117151819A (zh) * 2023-09-04 2023-12-01 杭州易靓好车互联网科技有限公司 基于数据分析的交易用户风险推荐方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469263A (zh) * 2014-09-24 2016-04-06 阿里巴巴集团控股有限公司 一种商品推荐方法及装置
CN106485562B (zh) * 2015-09-01 2020-12-04 苏宁云计算有限公司 一种基于用户历史行为的商品信息推荐方法及系统
CN106570008B (zh) * 2015-10-09 2020-03-27 阿里巴巴集团控股有限公司 推荐方法及装置
CN105894357A (zh) * 2016-03-30 2016-08-24 北京金山安全软件有限公司 商品信息推送方法及装置
CN107590675B (zh) * 2017-07-25 2021-01-08 广州智选网络科技有限公司 一种基于大数据的用户购物行为识别方法、储存设备及移动终端
CN107705183B (zh) * 2017-09-30 2021-04-27 深圳乐信软件技术有限公司 一种商品的推荐方法、装置、存储介质及服务器

Also Published As

Publication number Publication date
CN109191240A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
CN109191240B (zh) 一种进行商品推荐的方法和装置
CN108805598B (zh) 相似度信息确定方法、服务器及计算机可读存储介质
CN106251174A (zh) 信息推荐方法及装置
CN105469263A (zh) 一种商品推荐方法及装置
CN110008397B (zh) 一种推荐模型训练方法及装置
WO2015034850A2 (en) Feature selection for recommender systems
JP2019125007A (ja) 情報分析装置、情報分析方法および情報分析プログラム
Yan et al. Implementation of a product-recommender system in an IoT-based smart shopping using fuzzy logic and apriori algorithm
CN111400613A (zh) 物品推荐方法、装置、介质及计算机设备
US20230093756A1 (en) Systems and methods for generating recommendations
CN113946754A (zh) 基于用户画像的权益推荐方法、装置、设备及存储介质
CN111488385A (zh) 基于人工智能的数据处理方法、装置和计算机设备
JP2019164706A (ja) 情報処理装置、情報処理方法、およびプログラム
Lin et al. A consumer review-driven recommender service for web e-commerce
CN113065062A (zh) 一种基于用户阅读时间行为的新闻推荐方法及系统
CN115392947A (zh) 需求量预测方法以及装置
CN110264277B (zh) 由计算设备执行的数据处理方法及装置、介质和计算设备
CN109670922B (zh) 一种基于混合特征的线上图书价值发现方法
CN110765346A (zh) 用户意图挖掘方法、装置以及设备
KR20190100789A (ko) 개인화 알고리즘을 이용하여 고객 로그 맞춤형 사이트를 추천하는 방법 및 개인화 알고리즘 서버
Diwandari et al. Research Methodology for Analysis of E-Commerce User Activity Based on User Interest using Web Usage Mining.
Bajpai et al. An improved dynamic e-commerce recommendation system
CN112632275A (zh) 基于个人文本信息的人群聚类数据处理方法、装置及设备
CN112307298A (zh) 个人品牌标签的生成方法及其装置
CN117688251B (zh) 一种基于知识图谱的商品检索方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant