CN105913290A - 商品搭配推荐方法及推荐系统 - Google Patents

商品搭配推荐方法及推荐系统 Download PDF

Info

Publication number
CN105913290A
CN105913290A CN201610509889.5A CN201610509889A CN105913290A CN 105913290 A CN105913290 A CN 105913290A CN 201610509889 A CN201610509889 A CN 201610509889A CN 105913290 A CN105913290 A CN 105913290A
Authority
CN
China
Prior art keywords
similarity
commodity
commodities
collocation
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610509889.5A
Other languages
English (en)
Inventor
杨成
李晨
张随雨
易芃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN201610509889.5A priority Critical patent/CN105913290A/zh
Publication of CN105913290A publication Critical patent/CN105913290A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0253During e-commerce, i.e. online transactions

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种商品搭配推荐方法及推荐系统,该方法包括根据商品库中商品的标题分词计算商品之间的相似度;利用用户的购买行为记录对所述商品之间的相似度进行修正;按照从大到小的顺序分别对每个商品的相似度进行排序得到该商品的相似度序列,并截取所述相似度序列中设定个数的序列值以建立相似度矩阵;基于所述相似度矩阵进行搜索以获取各商品的搭配推荐集合。该方法能够显著提高搭配预测的准确度,可以与时尚行业的现实需求相结合,具有广泛的适应性。

Description

商品搭配推荐方法及推荐系统
技术领域
本发明属于数据处理领域,尤其涉及商品数据的处理,具体的说,是涉及一种商品搭配推荐方法及推荐系统。
背景技术
现如今,随着网络技术的发展,互联网购物已经日益成为人们生活中一种重要的购物方式。但由于互联网购物的交互与交易方式的限制,用户常常不能挑选到满意的商品。为了提高用户在网上购物的体验,针对互联网购物的辅助推荐应用系统越来越被人们所关注。
例如,目前已经提出几种用于服装搭配的应用平台,包括Magic mirror,SuitUp和Vimeo。这些应用平台主要通过分析产品的文本标记信息进行推荐。具体的,有些推荐平台基于改进的贝叶斯网络提出,有些则是基于本体论、基于模糊集合论提出的推荐系统。上述应用平台在向用户推荐搭配商品时,可以缩小用户搜索商品时的范围,简化用户在挑选商品时的操作,同时在一定程度上满足用户的要求。但现有辅助推荐的应用平台普遍存在下列问题,不能较好地满足用户的喜好和兴趣,推荐的准确度低。
综上,亟需一种针对商品之间的搭配进行推荐的方法以提高推荐的准确度,更好地满足用户的喜好。
发明内容
本发明所要解决的技术问题之一是需要提供一种针对商品之间的搭配进行推荐的方法以提高推荐的准确度。
为了解决上述技术问题,本申请的实施例首先提供了一种商品搭配推荐方法,包括:根据商品库中商品的标题分词计算商品之间的相似度;利用用户的购买行为记录对所述商品之间的相似度进行修正;按照从大到小的顺序分别对每个商品的相似度进行排序得到该商品的相似度序列,并截取所述相似度序列中设定个数的序列值以建立相似度矩阵;基于所述相似度矩阵进行搜索以获取各商品的搭配推荐集合。
优选地,所述根据商品库中商品的标题分词计算商品之间的相似度,包括:根据商品所属的类目将商品划分为不同的类集合;假设所述类集合中各标题分词出现的概率相同,计算任意两个商品之间的第一相似度;假设所述类集合中各标题分词出现的概率不同,计算任意两个商品之间的第二相似度;以所述第一相似度与所述第二相似度的线性组合作为商品之间的相似度。
优选地,所述计算任意两个商品之间的第二相似度,包括:根据各标题分词在所述类集合中出现的概率计算标题分词的权重值;基于所述标题分词的权重值,根据如下表达式计算任意两个商品之间的第二相似度SimC(Ia,Ib):
S i m C ( I a , I b ) = Σ w k C j ∈ W I a ∩ W I b W e i g h t ( w k C j ) 2 Σ w k C j ∈ W I a W e i g h t ( w k C j ) 2 * Σ w k C j ∈ W I b W e i g h t ( w k C j ) 2
其中,分别表示商品Ia和Ib的标题分词集合,表示类集合Cj中标题分词的权重值。
优选地,所述利用用户的购买行为记录对所述商品之间的相似度进行修正,包括:根据用户的购买行为记录中所记录的某个商品的购买日期计算该商品的购买日期的平均值;基于所述购买日期的平均值确定该商品的购买系数;利用所述购买日期的平均值与购买系数对商品之间的相似度进行修正。
优选地,所述基于所述相似度矩阵进行搜索以获取各商品的搭配推荐集合,包括:获取参照商品Ik的搭配推荐集合时,从所述相似度矩阵中Ik所在的行开始搜索,将该行中的各相似度的值与预设的相似度阈值依次进行比较:当被比较的相似度的值小于等于时,终止对Ik所在的行的搜索过程,获取参照商品Ik的搭配推荐集合的过程结束;当被比较的相似度的值大于时,根据商品的搭配套餐库中与所述相似度对应的商品Ii的搭配列表确定参照商品Ik的搭配推荐集合。
优选地,所述根据商品的搭配套餐库中与所述相似度对应的商品Ii的搭配列表确定参照商品Ik的搭配推荐集合,包括:查询商品的搭配套餐库中是否存在包含与所述相似度对应的商品Ii的搭配列表:若存在包含与所述相似度对应的商品Ii的搭配列表,则将所述搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合,然后返回所述相似度矩阵中Ik所在的行继续比较该行中下一个相似度与所述预设的相似度阈值若不存在包含与所述相似度对应的商品Ii的搭配列表,则对相似度矩阵中Ii所在的行进行递归搜索。
优选地,所述对相似度矩阵中Ii所在的行进行递归搜索,包括:重新确定用于本层搜索的本层相似度阈值指标;将该行中的各相似度的值与本层相似度阈值指标依次进行比较:当被比较的相似度的值小于等于本层相似度阈值指标时,终止对Ii所在的行的搜索过程,返回进入Ii行之前的上一层搜索,并继续比较上一层搜索中位于商品Ii后面的相似度与上一层搜索中的相似度阈值指标;当被比较的相似度的值大于本层相似度阈值指标时,查询商品的搭配套餐库中是否存在包含与所述相似度对应的商品Ij的搭配列表;若存在包含与所述相似度对应的商品Ij的搭配列表,则将所述搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合,然后返回所述相似度矩阵中Ii所在的行继续比较该行中下一个相似度与本层相似度阈值指标;若不存在包含与所述相似度对应的商品Ij的搭配列表,则对相似度矩阵中Ij所在的行进行递归搜索。
优选地,在将与所述相似度对应的商品Ii的搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合后还包括,判断所述参照商品Ik的搭配推荐集合中是否已经存在加入的商品,若已经存在加入的商品,则将加入的商品和参照商品Ik之间的相似度更新为其原有值与相似度的值中较大的值。
优选地,在获取参照商品Ik的搭配推荐集合的过程结束后,将所述搭配推荐集合中的商品按照各商品与参照商品Ik之间的相似度的值按照从大到小的顺序进行排列,截取包含设定数量商品的序列作为参照商品Ik的搭配列表。
本申请的实施例还提供了一种商品搭配推荐系统,包括:相似度计算模块,其根据商品库中商品的标题分词计算商品之间的相似度;相似度修正模块,其利用用户的购买行为记录对所述商品之间的相似度进行修正;相似度矩阵建立模块,其按照从大到小的顺序依次对每个商品的相似度进行排序得到该商品的相似度序列,截取所述相似度序列中设定个数的序列值,以全部商品的相似度序列建立相似度矩阵;相似度矩阵搜索模块,其基于所述相似度矩阵进行搜索以获取各商品的搭配推荐集合。
与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:
通过分别基于热门商品和冷门商品分别构建相似度,以及根据用户历史行为对相似度进行修正并建立相似度举证,进而针对相似度矩阵对商品的搭配进行推荐,显著地提高了搭配预测的准确度。
本发明的其他优点、目标,和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本申请的技术方案或现有技术的进一步理解,并且构成说明书的一部分。其中,表达本申请实施例的附图与本申请的实施例一起用于解释本申请的技术方案,但并不构成对本申请技术方案的限制。
图1为根据本发明一实施例的商品搭配推荐方法的流程示意图;
图2为根据本发明实施例的对相似度矩阵进行搜索的流程示意图;
图3为根据本发明另一实施例的商品搭配推荐系统的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成相应技术效果的实现过程能充分理解并据以实施。本申请实施例以及实施例中的各个特征,在不相冲突前提下可以相互结合,所形成的技术方案均在本发明的保护范围之内。
图1为根据本发明一实施例的商品搭配推荐方法的流程示意图,如图所示,该推荐方法包括:
步骤S110、根据商品库中商品的标题分词计算商品之间的相似度。
步骤S120、利用用户的购买行为记录对商品之间的相似度进行修正。
步骤S130、按照从大到小的顺序分别对每个商品的相似度进行排序得到该商品的相似度序列,并截取相似度序列中设定个数的序列值以建立相似度矩阵。
步骤S140、基于相似度矩阵进行搜索以获取各商品的搭配推荐集合。
具体的,首先定义商品库中与商品有关的集合的构成:
由商品库中所有商品构成的集合记为I={I1,I2,...,IN},其中Ii表示第i个商品。
由商品库中所有商品的标题分词构成的集合记为W={w1,w2,...,wQ},其中wk表示第k个标题分词。
由商品库中的第i个商品的标题分词构成的集合记为
由商品库中的商品所属的类目构成的集合记为C:{C1,C2,...,CM},其中Cj表示第j个类别。
由商品库中属于第j类商品的所有商品构成的集合记为其中表示包含在第j类商品中的第i个。
由商品库中属于第j类商品的所有商品的标题分词构成的集合记为
在步骤S110中,考虑到可获取商品信息主要为商品描述信息,即商品所属类目和标题分词。因此在本发明的实施例中采取了标签本文相似度的算法,分析商品之间的相似度。具体来说,结合商品分词,度量商品分词集合之间的相似性,计算商品的相似度。在利用标题分词计算商品之间的相似度时,具体包括:
步骤S1101、根据商品所属的类目将商品划分为不同的类集合。
步骤S1102、假设在某个类集合中各标题分词出现的概率相同,计算任意两个商品之间的第一相似度。
步骤S1103、假设在某个类集合中各标题分词出现的概率不同,计算任意两个商品之间的第二相似度。
步骤S1104、根据第一相似度和第二相似度确定任意两个商品之间的相似度。
标题分词对商品相似性的影响应限制在同属于一类的商品,比如标题分词“陶瓷”,对于器皿类的生活用品来说,就是一种出现频率较高的标题分词。而对于办公文具类的商品来说,其出现频率则非常低。因此,在计算相似度之前,先对商品库中的商品进行分类,在各商品所属的类集合中考虑其标题分词的影响。接下来分别计算第一相似度(JACCARD相似度)和计算优化过的第二相似度(COSINE相似度)。
JACCARD相似度作为基础相似度计算方法,在计算商品之间的JACCARD相似度时,默认单个分词对商品相似度权重的影响值相同,即在某个类集合中各标题分词出现的概率相同,根据表达式(1)计算商品Ia和Ib之间的JACCARD相似度SimJ(Ia,Ib):
S i m J ( I a , I b ) = | W I a ∩ W I b | | W I a ∪ W I b | , I a ∈ I C j , I b ∈ I C j - - - ( 1 )
式中,分别表示商品Ia和Ib的标题分词集合,符号|·|表示集合中元素的个数。且商品Ia和Ib均属于第j类商品的集合
通过对JACCARD相似度的计算结果进行度量发现,JACCARD相似度对热门商品的相似度度量精度较高。但涉及到冷门商品,尤其是标题分词出现小众词汇时,相似度计算的精确度有限。这是因为,分词的描述对商品相似度的贡献具有差异性。例如在某一分类商品“茶壶”中,标题中的分词“茶壶”和分词“磨砂”相比,由于在此分类中,商品标题中出现分词“茶壶”的概率要高于出现分词“磨砂”的概率,因此对商品质地的描述分词“磨砂”比对商品内容的描述分词“茶壶”在计算相似度时权重更大。通过提高冷门分词的相似度权重,提高在相似度计算时对小众商品相似度度量的准确率。因此,在本发明的实施例中,引入了第二相似度,即优化过的COSINE相似度。
首先根据各标题分词在其所属的类集合中出现的概率计算标题分词的权重值,根据类内总分词词频数和某个分词出现的词频数,计算每个分词的权重。对某个分词其权重的计算如表达式(2)所示:
W e i g h t ( w k C j ) = l o g | I C j | | { I i C j | w k C j ∈ W I i , I i ∈ I C j } | - - - ( 2 )
式中,符号|·|表示集合中元素的个数,表示在当前类别的商品集中,标题分词中包含分词的商品集合。
进一步地,基于标题分词的权重值,根据如下表达式计算任意两个商品Ia和Ib之间的COSINE相似度SimC(Ia,Ib):
S i m C ( I a , I b ) = Σ w k C j ∈ W I a ∩ W I b W e i g h t ( w k C j ) 2 Σ w k C j ∈ W I a W e i g h t ( w k C j ) 2 * Σ w k C j ∈ W I b W e i g h t ( w k C j ) 2 - - - ( 3 )
式中,分别表示商品Ia和Ib的标题分词集合,表示商品Ia和Ib中共同出现的分词 表示类集合Cj中标题分词的权重值。且商品Ia和Ib均属于第j类商品的集合
为了得到较好的相似度度量结果,以第一相似度与第二相似度的线性组合作为商品之间的相似度,其结合了JACCARD相似度对热门商品的相似度计算优势和COSINE相似度对冷门商品的相似度计算优势,最终得到商品Ia,Ib的相似度,如表达式(4)所示:
Sim(Ia,Ib)=ω1*SimJ(Ia,Ib)+ω2*SimC(Ia,Ib) (4)
式中,ω1和ω2均为系数,ω1和ω2根据实际中热门商品和冷门商品所占的不同的比重进行选取。举例而言,一般情况下可以认为热门商品和冷门商品的比重相当,则取ω1=ω2=0.5。
在初步确定了商品之间的相似度的值后,接下来在步骤S120中,对相似度进行进一步地修正。包括,首先根据用户的购买行为记录中所记录的某个商品的购买日期计算该商品的购买日期的平均值,再基于得到的购买日期的平均值确定该商品的购买系数,最后利用购买日期的平均值与购买系数对商品之间的相似度进行修正。
具体的,获取某个商品的所有用户行为历史,提取日期的月份格式化后取平均值,如表达式(5)所示:
D ‾ ( I k ) = D 1 I k + D 2 I k + D 3 I k + ... + D n I k n - - - ( 5 )
式中,为商品Ik的第i个用户行为数据的日期。通过用户行为历史表,根据商品及购买日期两个字段可以将商品限定在大致的时间段,以排除夏季与冬季等不符合常识的搭配推荐出现。
搜索当前商品Ik的相似商品列表,对相似度进行如下修正:
式中,Sim(Ik,Ii)和Sim′(Ik,Ii)分别表示商品Ik及与Ik相似的商品Ii之间的修正前和修正后的相似度,分别表示商品Ik和商品Ii的购买日期的平均值,U为购买系数,符号|·|表示绝对值。
购买系数U可以基于日期格式与相似度进行调节,U越大则用户购买日期对相似度影响越小。当商品Ik及与Ik相似的商品Ii之间的购买月份平均值相差超过5个月时,相似度更新为0,否则基于月份间隔对原相似度乘以系数。
接下来,在步骤S130中,依次对商品库中的每个商品Ik进行相似度排序。具体为,整理并取前M个相似度的值,即对于Ik将Sim(Ik,Ii),i=1,2,...,N进行从大到小的排序。定义与参照商品Ik相关的相似度排序由大到小的M个商品集合为则所有商品排序后的相似度矩阵为:
R = S 1 I 1 S 2 I 1 ... S M I 1 S 1 I 2 ... ... S M I N - 1 S 1 I N S 2 I N ... S M I N - - - ( 7 )
相似度矩阵R的第一列必定为参照商品本身,相似度为1.0。R的每一行表示与当前参照商品相似度从大到小排序后的每个商品。
在步骤S140中,以对参照商品Ik的搜索过程为例说明基于相似度矩阵进行搜索以获取各商品的搭配推荐集合的过程。下面结合图2进行说明。
在获取参照商品Ik的搭配推荐集合时,从相似度矩阵R中参照商品Ik所在的行开始搜索,将该行中的各相似度的值与预设的相似度阈值依次进行比较。
当被比较的相似度的值小于等于时,由于相似度矩阵中的各相似度的值是降序排列的,因此的值小于等于时,位于后面的相似度的值也一定小于等于所以终止对Ik所在的行的搜索过程,获取参照商品Ik的搭配推荐集合的过程结束。
当被比较的相似度的值大于时,查询商品的搭配套餐库,并根据商品的搭配套餐库中与相似度对应的商品Ii的搭配列表确定参照商品Ik的搭配推荐集合。
进一步地,查询商品的搭配套餐库时,首先查询库中是否存在包含与相似度对应的商品Ii的搭配列表,若存在包含与相似度对应的商品Ii的搭配列表,则将搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合,然后返回相似度矩阵R中参照商品Ik所在的行继续比较该行中下一个相似度与预设的相似度阈值若不存在包含与相似度对应的商品Ii的搭配列表,则对相似度矩阵中Ii所在的行进行递归搜索。
递归搜索的过程包括,重新确定用于本层搜索的本层相似度阈值指标。将该行中的各相似度的值与本层相似度阈值指标依次进行比较。当被比较的相似度的值小于等于本层相似度阈值指标时,终止对Ii所在的行的搜索过程,返回进入Ii行之前的上一层搜索,并继续比较上一层搜索中位于商品Ii后面的相似度与上一层搜索中的相似度阈值指标。当被比较的相似度的值大于本层相似度阈值指标时,查询商品的搭配套餐库中是否存在包含与相似度对应的商品Ij的搭配列表。若存在包含与相似度对应的商品Ij的搭配列表,则将搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合,然后返回相似度矩阵中Ii所在的行继续比较该行中下一个相似度与本层相似度阈值指标。若不存在包含与相似度对应的商品Ij的搭配列表,则对相似度矩阵中Ij所在的行进行递归搜索。
递归搜索过程包含多个嵌套的递归过程,上一层搜索指的是位于外层的调用的主体,本层搜索指的是位于内层的被调用的部分。每一层都对应自己所属当层搜索的相似度阈值指标,且位于内层的相似度阈值指标较调用其的外层的相似度阈值指标递减。
举例而言,当前参照商品Ik所在的层(即最外层)的相似度阈值指标(即预设的相似度阈值)为从调用其所在行商品Ii进行递归搜索时,商品Ii的递归搜索所使用的相似度阈值指标(记为)的值设置为在的基础上乘以一个小于1的系数,比如以此类推,若从商品Ii的递归搜索中继续调用Ii所在行商品Ij进行递归搜索,则商品Ii的递归搜索所使用的相似度阈值指标(记为)的值设置为通过对不同递归搜索层的相似度阈值指标的处理,使得搭配结果与商品之间的相似度相适应,提高了商品搭配的准确度。
需要说明的是,在上述搜索过程中,在将在商品的搭配套餐库中存在搭配列表的搭配商品加入参照商品Ik的搭配推荐集合后还要判断参照商品Ik的搭配推荐集合中是否已经存在加入的商品,若已经存在加入的商品,则将加入的商品和参照商品Ik之间的相似度更新为其原有值与相似度的值中较大的值。这是因为尽管商品之间的相似度值并不高,但搭配的可能性很高,基于此对搭配结果与商品之间的相似度的关系进行修正,进一步提高了商品搭配的准确度。
对相似度矩阵R逐行进行上述搜索过程,当遍历相似度矩阵R中的所有行时,即完成对全部商品的搭配推荐集合的建立。接下来,对于每个商品,将搭配推荐集合中的与该商品搭配的商品按照各搭配商品与该商品之间的相似度的值按照从大到小的顺序进行排列,截取包含设定数量(例如200个)商品的序列作为该商品的搭配列表。
通过上述推荐过程,已经为每个待预测商品推荐200个可能的搭配商品,这些推荐商品是否准确,采用下面的评价指标进行验证。
对于每个商品采用平滑后的Mean Average Precision@200作为评测指标,如表达式(8)所示:
ap i @ 200 = Σ k = 1 200 1 1 - ln p ( k ) * Δ ( k ) n - - - ( 8 )
式中,n为对应于某件商品的搭配推荐集合中搭配商品的数量,p(k)为k截断前的预测准确率,Δ(k)为第k个商品是否在搭配推荐集合中的二值表示,如果存在记为1,如果不存在记为0。
最后对所有待预测商品的api@200求平均值作为最后的评价指标,它应该为一个0到1区间的值,越接近1说明预测的结果越准确。
本发明实施例的商品推荐方法,基于商品之间的相似度以及客户的购买行为记录对商品之间的搭配进行预测,显著地提高了搭配预测的准确度。
另外,通过结合时尚行业的现实需求,以及提出的系统构架和方法,形成了一个较为完善的面向网络海量时尚多媒体信息的智能服装特征分析和推荐系统,具有广泛的适应性。
在本发明的其他实施例中,还提出了一种商品搭配推荐系统,如图3所示,该系统包括:
相似度计算模块31,其根据商品库中商品的标题分词计算商品之间的相似度。
相似度修正模块32,其利用用户的购买行为记录对商品之间的相似度进行修正。
相似度矩阵建立模块33,其按照从大到小的顺序依次对每个商品的相似度进行排序得到该商品的相似度序列,截取相似度序列中设定个数的序列值,以全部商品的相似度序列建立相似度矩阵。
相似度矩阵搜索模块34,其基于相似度矩阵进行搜索以获取各商品的搭配推荐集合。
更多相关的功能的实现可以参考前述实施例中的推荐方法的各步骤,此处不再赘述。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (10)

1.一种商品搭配推荐方法,包括:
根据商品库中商品的标题分词计算商品之间的相似度;
利用用户的购买行为记录对所述商品之间的相似度进行修正;
按照从大到小的顺序分别对每个商品的相似度进行排序得到该商品的相似度序列,并截取所述相似度序列中设定个数的序列值以建立相似度矩阵;
基于所述相似度矩阵进行搜索以获取各商品的搭配推荐集合。
2.根据权利要求1所述的方法,其特征在于,所述根据商品库中商品的标题分词计算商品之间的相似度,包括:
根据商品所属的类目将商品划分为不同的类集合;
假设所述类集合中各标题分词出现的概率相同,计算任意两个商品之间的第一相似度;
假设所述类集合中各标题分词出现的概率不同,计算任意两个商品之间的第二相似度;
以所述第一相似度与所述第二相似度的线性组合作为商品之间的相似度。
3.根据权利要求2所述的方法,其特征在于,所述计算任意两个商品之间的第二相似度,包括:
根据各标题分词在所述类集合中出现的概率计算标题分词的权重值;
基于所述标题分词的权重值,根据如下表达式计算任意两个商品之间的第二相似度SimC(Ia,Ib):
S i m C ( I a , I b ) = Σ w k C j ∈ W I a ∩ W I b W e i g h t ( w k C j ) 2 Σ w k C j ∈ W I a W e i g h t ( w k C j ) 2 * Σ w k C j ∈ W I b W e i g h t ( w k C j ) 2
其中,分别表示商品Ia和Ib的标题分词集合,表示类集合Cj中标题分词的权重值。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述利用用户的购买行为记录对所述商品之间的相似度进行修正,包括:
根据用户的购买行为记录中所记录的某个商品的购买日期计算该商品的购买日期的平均值;
基于所述购买日期的平均值确定该商品的购买系数;
利用所述购买日期的平均值与购买系数对商品之间的相似度进行修正。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述基于所述相似度矩阵进行搜索以获取各商品的搭配推荐集合,包括:
获取参照商品Ik的搭配推荐集合时,从所述相似度矩阵中Ik所在的行开始搜索,将该行中的各相似度的值与预设的相似度阈值依次进行比较:
当被比较的相似度的值小于等于时,终止对Ik所在的行的搜索过程,获取参照商品Ik的搭配推荐集合的过程结束;
当被比较的相似度的值大于时,根据商品的搭配套餐库中与所述相似度对应的商品Ii的搭配列表确定参照商品Ik的搭配推荐集合。
6.根据权利要求5所述的方法,其特征在于,所述根据商品的搭配套餐库中与所述相似度对应的商品Ii的搭配列表确定参照商品Ik的搭配推荐集合,包括:
查询商品的搭配套餐库中是否存在包含与所述相似度对应的商品Ii的搭配列表:
若存在包含与所述相似度对应的商品Ii的搭配列表,则将所述搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合,然后返回所述相似度矩阵中Ik所在的行继续比较该行中下一个相似度与所述预设的相似度阈值
若不存在包含与所述相似度对应的商品Ii的搭配列表,则对相似度矩阵中Ii所在的行进行递归搜索。
7.根据权利要求6所述的方法,其特征在于,所述对相似度矩阵中Ii所在的行进行递归搜索,包括:
重新确定用于本层搜索的本层相似度阈值指标;
将该行中的各相似度的值与本层相似度阈值指标依次进行比较:
当被比较的相似度的值小于等于本层相似度阈值指标时,终止对Ii所在的行的搜索过程,返回进入Ii行之前的上一层搜索,并继续比较上一层搜索中位于商品Ii后面的相似度与上一层搜索中的相似度阈值指标;
当被比较的相似度的值大于本层相似度阈值指标时,查询商品的搭配套餐库中是否存在包含与所述相似度对应的商品Ij的搭配列表;
若存在包含与所述相似度对应的商品Ij的搭配列表,则将所述搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合,然后返回所述相似度矩阵中Ii所在的行继续比较该行中下一个相似度与本层相似度阈值指标;
若不存在包含与所述相似度对应的商品Ij的搭配列表,则对相似度矩阵中Ij所在的行进行递归搜索。
8.根据权利要求6或7所述的方法,其特征在于,在将与所述相似度对应的商品Ii的搭配列表中的搭配商品加入参照商品Ik的搭配推荐集合后还包括,判断所述参照商品Ik的搭配推荐集合中是否已经存在加入的商品,若已经存在加入的商品,则将加入的商品和参照商品Ik之间的相似度更新为其原有值与相似度的值中较大的值。
9.根据权利要求8所述的方法,其特征在于,在获取参照商品Ik的搭配推荐集合的过程结束后,将所述搭配推荐集合中的商品按照各商品与参照商品Ik之间的相似度的值按照从大到小的顺序进行排列,截取包含设定数量商品的序列作为参照商品Ik的搭配列表。
10.一种商品搭配推荐系统,包括:
相似度计算模块,其根据商品库中商品的标题分词计算商品之间的相似度;
相似度修正模块,其利用用户的购买行为记录对所述商品之间的相似度进行修正;
相似度矩阵建立模块,其按照从大到小的顺序依次对每个商品的相似度进行排序得到该商品的相似度序列,截取所述相似度序列中设定个数的序列值,以全部商品的相似度序列建立相似度矩阵;
相似度矩阵搜索模块,其基于所述相似度矩阵进行搜索以获取各商品的搭配推荐集合。
CN201610509889.5A 2016-07-01 2016-07-01 商品搭配推荐方法及推荐系统 Pending CN105913290A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610509889.5A CN105913290A (zh) 2016-07-01 2016-07-01 商品搭配推荐方法及推荐系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610509889.5A CN105913290A (zh) 2016-07-01 2016-07-01 商品搭配推荐方法及推荐系统

Publications (1)

Publication Number Publication Date
CN105913290A true CN105913290A (zh) 2016-08-31

Family

ID=56753676

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610509889.5A Pending CN105913290A (zh) 2016-07-01 2016-07-01 商品搭配推荐方法及推荐系统

Country Status (1)

Country Link
CN (1) CN105913290A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108280183A (zh) * 2018-01-23 2018-07-13 余绍志 一种基于大数据匹配与gps定位的信息推送系统
CN108320185A (zh) * 2018-02-02 2018-07-24 深圳市喂车科技有限公司 一种油站非油品推荐方法、装置及可读存储介质
CN108596705A (zh) * 2018-03-23 2018-09-28 郑州大学西亚斯国际学院 一种适用于电子商务的商品与信息分类推荐方法及系统
CN108874813A (zh) * 2017-05-10 2018-11-23 腾讯科技(北京)有限公司 一种信息处理方法、装置及存储介质
CN109670161A (zh) * 2017-10-13 2019-04-23 北京京东尚科信息技术有限公司 商品相似度计算方法及装置、存储介质、电子设备
CN109754295A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 用于输出信息的方法和装置
CN110298716A (zh) * 2018-03-22 2019-10-01 北京京东尚科信息技术有限公司 信息推送方法和装置
CN110827046A (zh) * 2018-08-07 2020-02-21 北京京东尚科信息技术有限公司 一种场景推荐的方法和装置
CN111400513A (zh) * 2020-03-11 2020-07-10 北京字节跳动网络技术有限公司 数据处理方法、装置、计算机设备和存储介质
CN112116421A (zh) * 2020-09-09 2020-12-22 江苏亿讯网络科技有限公司 一种自建福利商城的商品优化推荐的方法和系统
CN113763114A (zh) * 2021-03-04 2021-12-07 北京沃东天骏信息技术有限公司 物品信息搭配方法、装置及存储介质
CN113807921A (zh) * 2021-09-17 2021-12-17 深圳市数聚湾区大数据研究院 数据商品推荐方法与装置、电子设备及计算机可读存储介质

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108874813A (zh) * 2017-05-10 2018-11-23 腾讯科技(北京)有限公司 一种信息处理方法、装置及存储介质
CN109670161B (zh) * 2017-10-13 2023-01-31 北京京东尚科信息技术有限公司 商品相似度计算方法及装置、存储介质、电子设备
CN109670161A (zh) * 2017-10-13 2019-04-23 北京京东尚科信息技术有限公司 商品相似度计算方法及装置、存储介质、电子设备
CN109754295A (zh) * 2017-11-06 2019-05-14 北京京东尚科信息技术有限公司 用于输出信息的方法和装置
CN108280183A (zh) * 2018-01-23 2018-07-13 余绍志 一种基于大数据匹配与gps定位的信息推送系统
CN108320185A (zh) * 2018-02-02 2018-07-24 深圳市喂车科技有限公司 一种油站非油品推荐方法、装置及可读存储介质
CN110298716A (zh) * 2018-03-22 2019-10-01 北京京东尚科信息技术有限公司 信息推送方法和装置
CN108596705A (zh) * 2018-03-23 2018-09-28 郑州大学西亚斯国际学院 一种适用于电子商务的商品与信息分类推荐方法及系统
CN110827046A (zh) * 2018-08-07 2020-02-21 北京京东尚科信息技术有限公司 一种场景推荐的方法和装置
CN111400513A (zh) * 2020-03-11 2020-07-10 北京字节跳动网络技术有限公司 数据处理方法、装置、计算机设备和存储介质
CN111400513B (zh) * 2020-03-11 2023-04-25 北京字节跳动网络技术有限公司 数据处理方法、装置、计算机设备和存储介质
CN112116421A (zh) * 2020-09-09 2020-12-22 江苏亿讯网络科技有限公司 一种自建福利商城的商品优化推荐的方法和系统
CN113763114A (zh) * 2021-03-04 2021-12-07 北京沃东天骏信息技术有限公司 物品信息搭配方法、装置及存储介质
CN113763114B (zh) * 2021-03-04 2024-07-16 北京沃东天骏信息技术有限公司 物品信息搭配方法、装置及存储介质
CN113807921A (zh) * 2021-09-17 2021-12-17 深圳市数聚湾区大数据研究院 数据商品推荐方法与装置、电子设备及计算机可读存储介质
CN113807921B (zh) * 2021-09-17 2023-11-24 深圳市数聚湾区大数据研究院 数据商品推荐方法与装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN105913290A (zh) 商品搭配推荐方法及推荐系统
CN108629665B (zh) 一种个性化商品推荐方法和系统
CN108876537B (zh) 一种用于网上商场系统的混合推荐方法
US7805431B2 (en) System and method for generating a display of tags
CN111949887B (zh) 物品推荐方法、装置及计算机可读存储介质
CN108664564B (zh) 一种基于物品内容特征的改进协同过滤推荐方法
CN106202519A (zh) 一种结合用户评论内容和评分的项目推荐方法
CN106471491A (zh) 一种时变的协同过滤推荐方法
CN107832338B (zh) 一种识别核心产品词的方法和系统
CN108109058B (zh) 一种融合人格特质和物品标签的单分类协同过滤方法
CN106157156A (zh) 一种基于用户社区的协作推荐系统
CN112102029B (zh) 一种基于知识图谱的长尾推荐计算方法
CN110619559B (zh) 基于大数据信息在电子商务中精准推荐商品的方法
CN114240575B (zh) 基于商品流行度及用户动态兴趣的商品推荐方法及系统
CN110941762A (zh) 一种个性化推荐系统排序结果的改进方法
CN115878903B (zh) 基于大数据的信息智能推荐方法
CN110727855A (zh) 一种基于改进因子分解机的个性化推荐方法
CN115131101A (zh) 一种保险产品个性化智能推荐系统
CN106777359A (zh) 一种基于受限玻尔兹曼机的文本业务推荐方法
CN107133811A (zh) 一种目标用户的识别方法和装置
CN107169830A (zh) 一种基于聚类pu矩阵分解的个性化推荐方法
CN113449200B (zh) 物品推荐方法、装置及计算机存储介质
CN110851694B (zh) 基于用户记忆网络和树形结构的深度模型的个性化推荐系统
CN110413880A (zh) 基于用户人格分层结构的单分类协同过滤方法
CN106777069A (zh) 基于矩阵因子分解的个性化推荐方法及推荐系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160831

RJ01 Rejection of invention patent application after publication