CN111507812A - 一种基于属性和标题的商品搭配推荐方法及装置 - Google Patents

一种基于属性和标题的商品搭配推荐方法及装置 Download PDF

Info

Publication number
CN111507812A
CN111507812A CN202010624426.XA CN202010624426A CN111507812A CN 111507812 A CN111507812 A CN 111507812A CN 202010624426 A CN202010624426 A CN 202010624426A CN 111507812 A CN111507812 A CN 111507812A
Authority
CN
China
Prior art keywords
commodity
commodities
matrix
vector
collocation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010624426.XA
Other languages
English (en)
Other versions
CN111507812B (zh
Inventor
王思宇
江岭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Xiaoduo Technology Co ltd
Original Assignee
Chengdu Xiaoduo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Xiaoduo Technology Co ltd filed Critical Chengdu Xiaoduo Technology Co ltd
Priority to CN202010624426.XA priority Critical patent/CN111507812B/zh
Publication of CN111507812A publication Critical patent/CN111507812A/zh
Application granted granted Critical
Publication of CN111507812B publication Critical patent/CN111507812B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于属性和标题的商品搭配推荐方法及装置,该方法通过获取一段时间内的用户订单信息获得获取商品间的搭配得分,并根据搭配得分的情况能够获得搭配得分较高的候选商品集,并且通过引入异质共现频率与异质共现逆频率来降低热门商品对商品间搭配的影响,从而获得较为准确的候选商品集;同时通过获取商品风格等属性的向量与商品标题的向量,并将两种类型的向量映射到向量空间中,学习两个商品间的搭配度,建立商品搭配模型,进而基于商品属性和标题更准确的获取商品间的搭配率;再根据用户购买或询问的商品信息,从该商品的候选商品集中能够匹配出搭配度最高的一个候选商品,该装置基于该方法,以精准推荐搭配商品为目的。

Description

一种基于属性和标题的商品搭配推荐方法及装置
技术领域
本发明涉及搭配推荐领域,特别是一种基于属性和标题的商品搭配推荐方法及装置。
背景技术
随着电子商务的发展,网上购物逐渐成为主流的购物方式。购物中,商家通常希望用户购买或关注某件商品后为其推荐搭配的商品,或者在用户咨询 “我买的这件T恤搭配什么样的裤子好了”等这样的问题时,能够快速且准确的给出答案,最终提高用户购物体验和促进商品销售。诸如此类的应用场景在服饰的购物中更为常见,由人来完成衣服的搭配组合配置虽然能解决以上问题但这无疑是一件费时且难度较大的工作,同时要求配置人员具有专业搭配知识。因此,如何自动的生成相对合理的商品搭配组合成为目前亟待解决的问题。
为了能自动辨别商品的搭配性,学术界和工业界已进行了大量的研究。早期的方法主要采用数据挖掘的方式,从用户历史购买序列中,自动挖掘频繁共现的商品对,但该方法不能解决冷启动问题,商家新上的商品是无法挖掘出搭配关系,同时由于商品的频繁共现不一定是搭配关系也有可能是重复购买的相似商品,因此最终挖掘出的商品对也存在大量的相似关系。
研究人员开始通过基于商品的图片信息的样式匹配模型。首先从购买序列中获得异质共现信息(dyadic co-occurrences)排除了商品的相似关系,然后从这些共现商品对的商品图片中学习样式。该方法基于Siamese CNN网络实现样式的匹配。由于从图片中学习样式匹配,对于新增的商品也能较好的识别搭配商品,解决了冷启动的问题,同时异质商品共现也有效的排除了相似关系。但是获取图片信息是非常耗时的工作,并且在大部分商品图片中除了囊括当前商品外还有许多背景商品,其售卖商品是上衣,但图可能包括了上衣,牛仔裤和皮包等多件商品,这样的图片无疑给模型带来大量的噪声。
为了克服依据商品图片判断搭配所带来的噪声问题,通过线上所售商品其标题包含商品的许多信息,例如“春秋2020新款ins复古高腰显瘦设计感开叉直筒牛仔裤女高腰九分裤”该标题中包含衣服的类型,款式,年份等信息,利用Siamese CNN网络从商品标题中提取特征,再将提取到的两个商品的特征映射到样式空间(stylespace),最终在该空间上实现搭配商品的匹配。同样地,还有技术也利用商品标题来提取特征,但与上述技术不同的是,该技术采用LSTM来提取特征实现了搭配匹配。将商品标题作为商品特征有效解决了图片中噪声的问题,获得比之前采用图片提取特征的模型更好的效果。但标题字数有限,单纯通过标题来获取商品的特征,会遗漏许多商品的重要信息。另一方面,训练这些模型需要大量专家标记的搭配数据集,这也是非常耗时的工作。
为了解决以上问题,我们构建了一个结合标题和商品属性知识图谱的模型用于商品样式匹配,并且我们提出一种自动构建商品搭配数据集的方法,通过该方法我们从历史订单中构建了搭配商品数据集,从而通过商品样式匹配模型计算用户购买商品与候选商品数据集中最搭配的一个商品。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于属性和标题的商品搭配推荐方法,其能够根据现有商品销售数据获取商品的候选搭配集,通过候选搭配集知识图谱训练空间向量模型,使训练后的模型能够选出候选搭配集中最适合的搭配商品,且能够有效实现新商品的冷启动。
本发明的目的通过以下技术方案来实现:
第一方面,一种基于属性和标题的商品搭配推荐方法,其步骤如下:
步骤S1,获取候选商品集中商品标题编码与商品属性编码的表示向量,并将两个向量映射到向量空间模型中,通过神经网络提取向量特征并训练学习商品间的搭配概率;
步骤S2,使用训练后的向量空间模型从候选商品集中挑选出最搭配的商品。
结合第一方面,所述步骤S1包括:
步骤S11,对商品标题进行编码并通过卷积操作获取商品标题向量;
步骤S12,将商品的多个属性向量化表示,得到商品属性矩阵
Figure 181545DEST_PATH_IMAGE001
其中
Figure DEST_PATH_IMAGE002
表示商品属性特征的总数,
Figure 974052DEST_PATH_IMAGE003
Figure DEST_PATH_IMAGE004
为超参数,再将商品属性矩阵
Figure 753789DEST_PATH_IMAGE005
拉平获得商品属性向量
Figure DEST_PATH_IMAGE006
步骤S13,将商品的商品标题向量和商品属性向量映射到向量空间模型中,通过神经网络提取向量特征并训练学习商品间的搭配概率。
其中所述步骤S11包括:
步骤S111,将商品标题按词划分并作为编码输入,获得矩阵
Figure 24365DEST_PATH_IMAGE007
Figure DEST_PATH_IMAGE008
,其中
Figure 838737DEST_PATH_IMAGE009
是标题的词长度,每个
Figure DEST_PATH_IMAGE010
均来自于词典V,
Figure 536566DEST_PATH_IMAGE011
,其中词典V根据商铺商品信息构建而成;
步骤S112,对矩阵S作为输入矩阵进行宽卷积操作,获得矩阵
Figure DEST_PATH_IMAGE012
,其中
Figure 678965DEST_PATH_IMAGE013
,其中
Figure DEST_PATH_IMAGE014
为卷积核的尺寸参数;
步骤S113,对矩阵C作为输出矩阵进行K-max池化,获得矩阵
Figure 877865DEST_PATH_IMAGE015
,其中
Figure DEST_PATH_IMAGE016
,
Figure 422110DEST_PATH_IMAGE017
为超参数;
步骤S114,将矩阵
Figure DEST_PATH_IMAGE018
作为输入矩阵重复所述步骤S112和步骤S113,获得矩阵
Figure 415474DEST_PATH_IMAGE019
Figure DEST_PATH_IMAGE020
,其中
Figure 45170DEST_PATH_IMAGE021
Figure DEST_PATH_IMAGE022
为超参数;
步骤S115,拉平矩阵
Figure 782182DEST_PATH_IMAGE023
获得商品标题向量
Figure DEST_PATH_IMAGE024
,其中
Figure 180933DEST_PATH_IMAGE025
Figure DEST_PATH_IMAGE026
Figure 610777DEST_PATH_IMAGE027
为超参数,
Figure DEST_PATH_IMAGE028
为可学习的参数。
其中所述步骤S13包括:将商品
Figure 727769DEST_PATH_IMAGE029
的标题向量
Figure DEST_PATH_IMAGE030
Figure 878259DEST_PATH_IMAGE031
和属性向量
Figure DEST_PATH_IMAGE032
Figure 521730DEST_PATH_IMAGE033
映射到向量空间,计算获得两种类型向量的搭配得分,即
Figure DEST_PATH_IMAGE034
Figure 732262DEST_PATH_IMAGE035
,其中
Figure DEST_PATH_IMAGE036
是两个商品的标题在向量空间上的搭配得分,
Figure 461184DEST_PATH_IMAGE037
为参数矩阵,用于将数据映射到该矩阵的矩阵空间中,
Figure DEST_PATH_IMAGE038
Figure 415365DEST_PATH_IMAGE039
则是两个商品的属性在向量空间上的搭配得分,
Figure DEST_PATH_IMAGE040
同样为参数矩阵,用于将数据映射到该矩阵的矩阵空间中,
Figure 913342DEST_PATH_IMAGE041
;通过标题向量搭配得分和属性向量搭配得分计算所述搭配概率,得到
Figure DEST_PATH_IMAGE042
,其中
Figure 560355DEST_PATH_IMAGE043
Figure DEST_PATH_IMAGE044
为偏置项。
结合第一方面,所述候选商品集的获取包括通过一段时间内用户的订单数据来获得商品共现矩阵,通过所述商品共现矩阵获得商品的异质共现频率和异质共现逆频率,并根据商品的所述异质共现频率和异质共现逆频率获得商品间的搭配评分。
其中所述异质共现频率为通过计算商品
Figure 510994DEST_PATH_IMAGE045
Figure DEST_PATH_IMAGE046
的共现次数和与商品
Figure 268865DEST_PATH_IMAGE045
共现的商品的次数之和的比值,从而获得商品
Figure 621349DEST_PATH_IMAGE045
与商品
Figure 563897DEST_PATH_IMAGE046
的异质共现频率
Figure 877198DEST_PATH_IMAGE047
其中,
Figure DEST_PATH_IMAGE048
是指商品
Figure 297815DEST_PATH_IMAGE049
的共现次数,而
Figure DEST_PATH_IMAGE050
是指与商品
Figure 645751DEST_PATH_IMAGE045
共现的商品的次数之和。
其中所述异质共现逆频率为通过计算商品总数和与商品
Figure 759200DEST_PATH_IMAGE046
共现的商品总数的比值,即异质共现逆频率为
Figure 684431DEST_PATH_IMAGE051
,其中
Figure DEST_PATH_IMAGE052
是商品总数,而
Figure 908739DEST_PATH_IMAGE053
表示与商品
Figure 845602DEST_PATH_IMAGE046
共现的商品总数。
其中所述商品
Figure 129953DEST_PATH_IMAGE045
Figure 542480DEST_PATH_IMAGE046
的搭配评分为异质共现频率与异质共现逆频率的乘积即
Figure DEST_PATH_IMAGE054
,其中
Figure 445845DEST_PATH_IMAGE055
为商品
Figure 627428DEST_PATH_IMAGE045
Figure 817100DEST_PATH_IMAGE046
的搭配的分值,并将所述搭配评分为前
Figure DEST_PATH_IMAGE056
个商品作为候选商品集
Figure 592290DEST_PATH_IMAGE057
并且与所述候选商品集对应的商品查询集为
Figure DEST_PATH_IMAGE058
Figure 158400DEST_PATH_IMAGE059
为第
Figure 460068DEST_PATH_IMAGE056
个候选商品
Figure DEST_PATH_IMAGE060
Figure 696009DEST_PATH_IMAGE056
为可变参数,除
Figure 83128DEST_PATH_IMAGE056
个商品外的其他商品随机标记为不搭配商品,
Figure 452929DEST_PATH_IMAGE061
为第
Figure DEST_PATH_IMAGE062
个查询商品
Figure 218891DEST_PATH_IMAGE063
所述步骤S2中所述最搭配的商品的获取如下:
其中用户购买的商品
Figure DEST_PATH_IMAGE064
,则计算与其最搭配的商品为
Figure 15946DEST_PATH_IMAGE065
,其中
Figure DEST_PATH_IMAGE066
为商品
Figure 500148DEST_PATH_IMAGE067
与候选商品
Figure DEST_PATH_IMAGE068
的所述搭配概率。
第二方面,一种商品搭配推荐装置,所述装置包括:
候选商品集生成模块,用于生成与商品查询集对应的候选商品集,所述候选商品集不包括热门商品;
商品标题向量生成模块,用于将商品的标题进行编码并通过卷积操作获取商品标题向量;
商品属性向量生成模块,用于将商品的多个属性进行向量化表示,得到商品属性矩阵,再将商品属性矩阵拉平获得商品属性向量;
向量空间学习模块,用于将两个商品的商品标题向量和商品属性向量映射到向量空间模型中,从而获得两个商品的搭配概率,所述向量空间学习模块通过所述候选商品集进行参数更新;
商品在线搭配模块,用于根据两个商品的商品标题向量和商品属性向量的搭配概率为用户购买或咨询的商品匹配候选商品集中最搭配的候选商品。
上述装置主要通过运行本发明中的方法从而达到为用户推荐最为搭配的商品的目的。
本发明具有以下优点:
本发明能够通过获取一段时间内的用户订单信息获得获取商品间的搭配得分,并根据搭配得分的情况能够获得搭配得分较高的候选商品集,并且通过引入异质共现频率与异质共现逆频率来降低热门商品对商品间搭配的影响,从而获得较为准确的候选商品集;同时通过获取商品风格等属性的向量与商品标题的向量,并将两种类型的向量映射到向量空间中,学习两个商品间的搭配度,建立空间向量模型,并使用候选商品集训练该空间向量模型,进而基于商品属性和标题更准确的获取商品间的搭配率;再根据用户购买或询问的商品信息,从该商品的候选商品集中能够匹配出搭配度最高的一个候选商品,进而达到精准推荐搭配商品的目的;可见,本方案在基于用户数据生成的商品搭配关系上,进一步结合商品标题和商品属性来推荐搭配的商品,从而得到搭配度更高的推荐,其次使用候选商品集训练的空间向量模型能够预测新增商品的搭配商品,从而解决新商品冷启动的问题。
附图说明
图1 为本发明的流程图;
图2 为本发明商品标题编码模型的一个实施例;
图3为本发明的向量空间匹配模型架构图;
图4为本发明的装置结构示意图。
具体实施方式
为使发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例提供一种基于属性和标题的商品搭配推荐方法,如图1所示,包括步骤S1和步骤S2,具体内容如下:
步骤S1,构建搭配匹配模型以获取商品件的搭配概率;首先对候选商品集中商品的标题进行编码进而从标题文字中获得商品的标题表示向量即标题向量,再对商品的属性进行编码进而从商品的知识图谱中获得商品的属性表示向量即属性向量,最后分别将两个向量映射到向量空间中,在该空间中,通过神经网络提取向量特征训练学习两个商品之间是否搭配,并获取两个商品间的搭配概率;其中商品的标题包括诸如商品的名字、类型、对应穿着季节、上市时间等信息,商品的属性则包括风格、色彩、原料、样式、规格等。
具体而言,步骤1包括:
步骤S11,对商品标题进行编码并通过商品标题编码模型的卷积操作获取商品标题向量;其中商品标题编码模型如图2所示,包括获得词组矩阵、第一次宽卷积、第一次K-max池化、第二次宽卷积、第二次K-max池化和全连接,具体步骤如下:
步骤S111,获得词组矩阵,将商品标题按词划分并作为编码输入,获得矩阵
Figure 673640DEST_PATH_IMAGE008
,其中
Figure 684322DEST_PATH_IMAGE009
是标题的词长度,每个
Figure 527644DEST_PATH_IMAGE010
均来自于词典V,
Figure 623776DEST_PATH_IMAGE011
,其中词典V根据商铺商品信息构建而成;如图2所示,当商品标题为“2020春夏时尚显瘦牛仔短裙”时,此时
Figure 335380DEST_PATH_IMAGE069
Figure DEST_PATH_IMAGE070
步骤S112,第一次宽卷积,将矩阵S作为输入矩阵进行宽卷积操作,获得矩阵
Figure 99371DEST_PATH_IMAGE012
,其中
Figure 238229DEST_PATH_IMAGE013
,其中
Figure 821657DEST_PATH_IMAGE014
为卷积核的尺寸参数;卷积的目的在于抽取特征,这里我们采用一维卷积来抽取标题句子中词的特征,一维卷积是基于两个向量
Figure 946739DEST_PATH_IMAGE071
Figure DEST_PATH_IMAGE072
是尺寸为
Figure 932012DEST_PATH_IMAGE014
的卷积核,而向量
Figure 241771DEST_PATH_IMAGE073
则是长度为
Figure 187861DEST_PATH_IMAGE009
的输入序列,此时有
Figure DEST_PATH_IMAGE074
;实际上此处有两种卷积类型,窄卷积和宽卷积,其中窄卷积需要
Figure 241268DEST_PATH_IMAGE075
Figure 81048DEST_PATH_IMAGE046
的取值范围从
Figure 437074DEST_PATH_IMAGE014
Figure 729515DEST_PATH_IMAGE009
,最终输出
Figure DEST_PATH_IMAGE076
;相反宽卷积则不需要
Figure 586613DEST_PATH_IMAGE075
Figure 156265DEST_PATH_IMAGE046
的取值范围从
Figure 807827DEST_PATH_IMAGE077
Figure DEST_PATH_IMAGE078
,最终输出序列
Figure 853143DEST_PATH_IMAGE079
;由于宽卷积对句子中所有的词一视同仁,每个词都计算相同的次数,从而有效的保证了商品标题中每个词对商品标题向量的最终影响,因此这里选择了宽卷积操作。
步骤S113,第一次K-max池化,对矩阵C作为输出矩阵进行K-max池化,获得矩阵
Figure 123719DEST_PATH_IMAGE015
,其中
Figure 672512DEST_PATH_IMAGE016
,
Figure 760553DEST_PATH_IMAGE017
为超参数;与卷积层一样,此处池化层每次对输入数据的一个固定形状窗口或池化窗口中的元素计算输出,不同于卷积层里计算输入和卷积核的互相关性,池化层直接计算池化窗口内元素的最大值或者平均值,该运算也分别叫做最大池化或平均池化,K-max池化是最大池化的一种特殊形式,最大池化是选择向量最大值,而K-max池化则选择向量的
Figure DEST_PATH_IMAGE080
个最大的值。
步骤S114,将第一次K-max池化获得的矩阵
Figure 902953DEST_PATH_IMAGE018
作为输入矩阵重复操作步骤S112和步骤S113,最终获得矩阵
Figure 101853DEST_PATH_IMAGE019
Figure 505152DEST_PATH_IMAGE020
,其中
Figure 764095DEST_PATH_IMAGE021
Figure 393791DEST_PATH_IMAGE022
为超参数。
在图2的例子中,第一次卷积的卷积核为3,第二次卷积的卷积核为2,第一次K-max池化的超参数
Figure 130803DEST_PATH_IMAGE017
为5,第二次K-max池化的超参数
Figure 654188DEST_PATH_IMAGE022
为3。
步骤S115,拉平矩阵
Figure 84032DEST_PATH_IMAGE081
获得商品标题向量
Figure 935445DEST_PATH_IMAGE024
,其中
Figure 476148DEST_PATH_IMAGE025
Figure 119619DEST_PATH_IMAGE026
Figure 454785DEST_PATH_IMAGE027
为超参数,
Figure 183707DEST_PATH_IMAGE028
为可学习的参数。
上述的超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,需要对超参数进行优化,给学习机选择一组最优超参数,以提高学习的性能和效果,在本实施例中,超参数随着模型的不断优化,也处于不断优化的状态中。
步骤S12,商品的标题虽然包括了许多商品的基本信息,但由于字数有限也存在许多信息的缺失,因此进一步引入商品的属性信息,以期待进一步完善的获取商品的各方面信息,从而使得商品间的搭配概率计算更为准确;为此我们用
Figure DEST_PATH_IMAGE082
表示商品的某一属性向量,将商品的多个属性向量化表示并拼接得到商品属性矩阵
Figure 137887DEST_PATH_IMAGE083
,其中
Figure 635865DEST_PATH_IMAGE002
表示商品属性特征的总数,
Figure DEST_PATH_IMAGE084
Figure 17299DEST_PATH_IMAGE085
为超参数,再将商品属性矩阵
Figure DEST_PATH_IMAGE086
拉平获得商品属性向量
Figure 233516DEST_PATH_IMAGE087
步骤S13,将商品的商品标题向量和商品属性向量映射到向量空间模型中,通过神经网络提取向量特征并训练学习商品的搭配概率,其中采用孪生卷积网络的结构来提取商品的标题特征,空间模型网络结构如图3所示,其具体步骤如下:
给定两个商品
Figure 116022DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE088
的标题向量
Figure 343872DEST_PATH_IMAGE030
Figure 286420DEST_PATH_IMAGE031
和属性向量
Figure 724355DEST_PATH_IMAGE032
Figure 20338DEST_PATH_IMAGE033
,并将两类向量映射到向量空间,计算获得两种类型向量的搭配得分,即
Figure 492907DEST_PATH_IMAGE034
Figure 340778DEST_PATH_IMAGE035
,其中
Figure 266008DEST_PATH_IMAGE036
是两个商品的标题在向量空间上的搭配得分,
Figure 365683DEST_PATH_IMAGE037
为参数矩阵,用于将数据映射到该矩阵的矩阵空间中,
Figure 692759DEST_PATH_IMAGE038
Figure 977110DEST_PATH_IMAGE039
则是两个商品的属性在向量空间上的搭配得分,
Figure 389636DEST_PATH_IMAGE040
同样为参数矩阵,用于将数据映射到该矩阵的矩阵空间中,
Figure 27422DEST_PATH_IMAGE041
;通过标题向量搭配得分和属性向量搭配得分计算所述搭配概率,得到
Figure 209005DEST_PATH_IMAGE042
,其中
Figure 664257DEST_PATH_IMAGE043
Figure 564080DEST_PATH_IMAGE044
为偏置项。
通过采用从用户订单中匹配的候选商品集对空间向量模型进行训练,从而使空间向量模型能够更好的预测新增商品的搭配商品,从而解决新商品冷启动的问题。
步骤S2,根据商品查询集
Figure 5557DEST_PATH_IMAGE058
,当用户购买一个商品
Figure 41646DEST_PATH_IMAGE064
,使用训练后的向量空间模型从候选商品集中挑选出最搭配的商品
Figure 667799DEST_PATH_IMAGE089
Figure DEST_PATH_IMAGE090
步骤S1、S2中候选商品集的获取具体过程如下:
候选商品集的获取包括通过店铺一段时间内用户的订单数据来获得商品共现矩阵,通过所述商品共现矩阵获得商品的异质共现频率和异质共现逆频率,并根据商品的所述异质共现频率和异质共现逆频率获得商品间的搭配评分。
在用户的订单数据中包含许多二元共现商品对,我们期望从这些二元共现商品对中选择出较为合理的搭配商品对,因此我们通过用户的订单数据情况来获取二元商品共现矩阵。
在一实施例中,获取用户购买商品信息,如下表中包括多个用户及其购买的商品情况信息。
Figure 930284DEST_PATH_IMAGE091
由于每个商品均属于某一类商品,进而将用户所购买的商品进行唯一分类,获得商品类目表如下。
Figure DEST_PATH_IMAGE092
根据用户商品购买信息以及其中各商品的类别情况,生成二元商品共现矩阵,其中通过用户商品购买信息产生对应的共现关系,并通过商品类别信息去掉同类商品的共现关系,使最终的搭配评分更加准确。
Figure 34507DEST_PATH_IMAGE093
异质共现频率为通过计算两个商品
Figure 190681DEST_PATH_IMAGE045
Figure 863102DEST_PATH_IMAGE046
的共现次数和与商品
Figure 471938DEST_PATH_IMAGE045
共现的商品的次数之和的比值,从而获得商品
Figure 645431DEST_PATH_IMAGE045
与商品
Figure 656112DEST_PATH_IMAGE046
的异质共现频率
Figure 233855DEST_PATH_IMAGE047
,其中,
Figure 329987DEST_PATH_IMAGE048
是指商品
Figure 776012DEST_PATH_IMAGE049
的共现次数,而
Figure 47724DEST_PATH_IMAGE050
是指与商品
Figure 186581DEST_PATH_IMAGE045
共现的商品的次数之和,异质共现频率主要表征当前商品
Figure 770010DEST_PATH_IMAGE045
与商品
Figure 895092DEST_PATH_IMAGE046
共现的频率,该值越大说明两个商品越容易共现。
异质共现逆频率为通过计算商品总数和与商品
Figure 880365DEST_PATH_IMAGE046
共现的商品总数的比值,即异质共现逆频率为
Figure 190124DEST_PATH_IMAGE051
,其中
Figure 136214DEST_PATH_IMAGE052
是商品总数,而
Figure 189621DEST_PATH_IMAGE053
表示与商品
Figure 904767DEST_PATH_IMAGE046
共现的商品总数;在实际情况中,往往会有一些热门商品会被不补分用户所购买,那么热门商品会影响商品共现关系的准确性,从而造成其与其他商品搭配的假象,进而影响最终的搭配评分,因此我们需要根据异质共现逆频率的结果来判断商品
Figure 385427DEST_PATH_IMAGE046
是否是一个热门商品,若其为热门商品,则不考虑其与其他的商品的共现关系。
获得异质共现频率与异质共现逆频率并排除不准确的共现关系后,商品
Figure 677868DEST_PATH_IMAGE045
Figure 534966DEST_PATH_IMAGE046
的搭配评分为异质共现频率与异质共现逆频率的乘积即
Figure 839039DEST_PATH_IMAGE054
,其中
Figure 490600DEST_PATH_IMAGE055
为商品
Figure 535917DEST_PATH_IMAGE045
Figure 931126DEST_PATH_IMAGE046
的搭配的分值,并将所述搭配评分为前
Figure 620864DEST_PATH_IMAGE056
个商品作为候选商品集
Figure 708906DEST_PATH_IMAGE057
并且与所述候选商品集对应的商品查询集为
Figure 975939DEST_PATH_IMAGE058
,其中
Figure 784626DEST_PATH_IMAGE059
为第
Figure 453505DEST_PATH_IMAGE056
个候选商品
Figure 712448DEST_PATH_IMAGE060
Figure 810985DEST_PATH_IMAGE056
为可变参数,除
Figure 813576DEST_PATH_IMAGE056
个商品外的其他商品随机标记为不搭配商品,
Figure 336962DEST_PATH_IMAGE061
为第
Figure 501227DEST_PATH_IMAGE062
个查询商品
Figure 883798DEST_PATH_IMAGE063
当用户购买或咨询的商品
Figure 424500DEST_PATH_IMAGE064
时,则通过标题向量搭配得分和属性向量搭配得分计算与其最搭配的商品为
Figure 802392DEST_PATH_IMAGE065
,其中
Figure 403138DEST_PATH_IMAGE066
为商品
Figure 476267DEST_PATH_IMAGE067
与候选商品
Figure 820661DEST_PATH_IMAGE068
的所述搭配概率。
本发明的装置实施例如图4所示,该装置包括:
候选商品集生成模块,用于生成与商品查询集对应的候选商品集,所述候选商品集不包括热门商品;
商品标题向量生成模块,用于将商品的标题进行编码并通过卷积操作获取商品标题向量;
商品属性向量生成模块,用于将商品的多个属性进行向量化表示,得到商品属性矩阵,再将商品属性矩阵拉平获得商品属性向量;
向量空间学习模块,用于将两个商品的商品标题向量和商品属性向量映射到向量空间模型中,从而获得两个商品的搭配概率,该模块使用候选商品集进行参数更新;
商品在线搭配模块,用于根据两个商品的商品标题向量和商品属性向量的搭配概率为用户购买或咨询的商品匹配候选商品集中最搭配的候选商品。
上述装置主要通过运行本发明中的方法从而达到为用户推荐最为搭配的商品的目的。

Claims (10)

1.一种基于属性和标题的商品搭配推荐方法,其特征在于,其步骤如下:
步骤S1,获取候选商品集中商品标题编码与商品属性编码的表示向量,并将两个向量映射到向量空间模型中,通过神经网络提取向量特征并训练学习商品间的搭配概率;
步骤S2,使用训练后的向量空间模型从候选商品集中挑选出最搭配的商品。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括:
步骤S11,对商品标题进行编码并通过卷积操作获取商品标题向量;
步骤S12,将商品的多个属性向量化表示,得到商品属性矩阵
Figure DEST_PATH_IMAGE001
,其中
Figure 391260DEST_PATH_IMAGE002
表示商品属性特征的总数,
Figure DEST_PATH_IMAGE003
Figure 617842DEST_PATH_IMAGE004
为超参数,再将商品属性矩阵
Figure DEST_PATH_IMAGE005
拉平获得商品属性向量
Figure 187364DEST_PATH_IMAGE006
步骤S13,将商品的商品标题向量和商品属性向量映射到向量空间模型中,通过神经网络提取向量特征并训练学习商品间的搭配概率。
3.根据权利要求2所述的方法,其特征在于,所述步骤S11包括:
步骤S111,将商品标题按词划分并作为编码输入,获得矩阵
Figure DEST_PATH_IMAGE007
,其中
Figure 524804DEST_PATH_IMAGE008
是标题的词长度,每个
Figure DEST_PATH_IMAGE009
均来自于词典V,
Figure 371537DEST_PATH_IMAGE010
,其中词典V根据商铺商品信息构建而成;
步骤S112,对矩阵S作为输入矩阵进行宽卷积操作,获得矩阵
Figure DEST_PATH_IMAGE011
,其中
Figure 769021DEST_PATH_IMAGE012
,其中
Figure DEST_PATH_IMAGE013
为卷积核的尺寸参数;
步骤S113,对矩阵C作为输出矩阵进行K-max池化,获得矩阵
Figure 825838DEST_PATH_IMAGE014
,其中
Figure DEST_PATH_IMAGE015
,
Figure 966970DEST_PATH_IMAGE016
为超参数;
步骤S114,将矩阵
Figure DEST_PATH_IMAGE017
作为输入矩阵重复所述步骤S112和步骤S113,获得矩阵
Figure 792843DEST_PATH_IMAGE018
Figure DEST_PATH_IMAGE019
,其中
Figure 626807DEST_PATH_IMAGE020
Figure DEST_PATH_IMAGE021
为超参数;
步骤S115,拉平矩阵
Figure 905342DEST_PATH_IMAGE022
获得商品标题向量
Figure DEST_PATH_IMAGE023
,其中
Figure 991109DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE025
Figure 405910DEST_PATH_IMAGE026
为超参数,
Figure DEST_PATH_IMAGE027
为可学习的参数。
4.根据权利要求2所述的方法,其特征在于,所述步骤S13包括:将商品
Figure 676355DEST_PATH_IMAGE028
的标题向量
Figure DEST_PATH_IMAGE029
Figure 176606DEST_PATH_IMAGE030
和属性向量
Figure DEST_PATH_IMAGE031
Figure 925119DEST_PATH_IMAGE032
映射到向量空间,计算获得两种类型向量的搭配得分,即
Figure DEST_PATH_IMAGE033
Figure 725585DEST_PATH_IMAGE034
,其中
Figure DEST_PATH_IMAGE035
是两个商品的标题在向量空间上的搭配得分,
Figure 901351DEST_PATH_IMAGE036
为参数矩阵,用于将数据映射到该矩阵的矩阵空间中,
Figure DEST_PATH_IMAGE037
Figure 29844DEST_PATH_IMAGE038
则是两个商品的属性在向量空间上的搭配得分,
Figure DEST_PATH_IMAGE039
同样为参数矩阵,用于将数据映射到该矩阵的矩阵空间中,
Figure 316469DEST_PATH_IMAGE040
;通过标题向量搭配得分和属性向量搭配得分计算所述搭配概率,得到
Figure DEST_PATH_IMAGE041
,其中
Figure 705862DEST_PATH_IMAGE042
Figure DEST_PATH_IMAGE043
为偏置项。
5.根据权利要求1所述的方法,其特征在于,所述候选商品集的获取包括通过一段时间内用户的订单数据来获得商品共现矩阵,通过所述商品共现矩阵获得商品的异质共现频率和异质共现逆频率,并根据商品的所述异质共现频率和异质共现逆频率获得商品间的搭配评分。
6.根据权利要求5所述的方法,其特征在于,所述异质共现频率为通过计算商品
Figure 52530DEST_PATH_IMAGE044
Figure DEST_PATH_IMAGE045
的共现次数和与商品
Figure 792953DEST_PATH_IMAGE044
共现的商品的次数之和的比值,从而获得商品
Figure 289793DEST_PATH_IMAGE044
与商品
Figure 64851DEST_PATH_IMAGE045
的异质共现频率
Figure 988945DEST_PATH_IMAGE046
,其中,
Figure DEST_PATH_IMAGE047
是指商品
Figure 951085DEST_PATH_IMAGE048
的共现次数,而
Figure DEST_PATH_IMAGE049
是指与商品
Figure 845091DEST_PATH_IMAGE044
共现的商品的次数之和。
7.根据权利要求6所述的方法,其特征在于,所述异质共现逆频率为通过计算商品总数和与商品
Figure 615601DEST_PATH_IMAGE045
共现的商品总数的比值,即异质共现逆频率为
Figure 569651DEST_PATH_IMAGE050
,其中
Figure DEST_PATH_IMAGE051
是商品总数,而
Figure 284666DEST_PATH_IMAGE052
表示与商品
Figure 123309DEST_PATH_IMAGE045
共现的商品总数。
8.根据权利要求7所述的方法,其特征在于,所述商品
Figure 607380DEST_PATH_IMAGE044
Figure 873276DEST_PATH_IMAGE045
的搭配评分为异质共现频率与异质共现逆频率的乘积即
Figure DEST_PATH_IMAGE053
,其中
Figure 810008DEST_PATH_IMAGE054
为商品
Figure 452342DEST_PATH_IMAGE044
Figure 790919DEST_PATH_IMAGE045
的搭配的分值,并将所述搭配评分为前
Figure DEST_PATH_IMAGE055
个商品作为候选商品集
Figure 86772DEST_PATH_IMAGE056
并且与所述候选商品集对应的商品查询集为
Figure DEST_PATH_IMAGE057
,其中
Figure 245220DEST_PATH_IMAGE058
为第
Figure 691245DEST_PATH_IMAGE055
个候选商品
Figure DEST_PATH_IMAGE059
Figure 618750DEST_PATH_IMAGE055
为可变参数,
Figure 351083DEST_PATH_IMAGE060
为第
Figure DEST_PATH_IMAGE061
个查询商品
Figure 137773DEST_PATH_IMAGE062
9.根据权利要求8所述的方法,其特征在于,所述步骤S2中所述最搭配的商品的获取如下:
用户购买的商品
Figure DEST_PATH_IMAGE063
,则计算与其最搭配的商品为
Figure 449806DEST_PATH_IMAGE064
,其中
Figure DEST_PATH_IMAGE065
为商品
Figure 762975DEST_PATH_IMAGE066
与候选商品
Figure DEST_PATH_IMAGE067
的所述搭配概率。
10.一种商品搭配推荐装置,其特征在于,所述装置包括:
候选商品集生成模块,用于生成与商品查询集对应的候选商品集,所述候选商品集不包括热门商品;
商品标题向量生成模块,用于将商品的标题进行编码并通过卷积操作获取商品标题向量;
商品属性向量生成模块,用于将商品的多个属性进行向量化表示,得到商品属性矩阵,再将商品属性矩阵拉平获得商品属性向量;
向量空间学习模块,用于将两个商品的商品标题向量和商品属性向量映射到向量空间模型中,从而获得两个商品的搭配概率,所述向量空间学习模块通过所述候选商品集进行参数更新;
商品在线搭配模块,用于根据两个商品的商品标题向量和商品属性向量的搭配概率为用户购买或咨询的商品匹配候选商品集中最搭配的候选商品。
CN202010624426.XA 2020-07-02 2020-07-02 一种基于属性和标题的商品搭配推荐方法及装置 Active CN111507812B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010624426.XA CN111507812B (zh) 2020-07-02 2020-07-02 一种基于属性和标题的商品搭配推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010624426.XA CN111507812B (zh) 2020-07-02 2020-07-02 一种基于属性和标题的商品搭配推荐方法及装置

Publications (2)

Publication Number Publication Date
CN111507812A true CN111507812A (zh) 2020-08-07
CN111507812B CN111507812B (zh) 2020-10-27

Family

ID=71872240

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010624426.XA Active CN111507812B (zh) 2020-07-02 2020-07-02 一种基于属性和标题的商品搭配推荐方法及装置

Country Status (1)

Country Link
CN (1) CN111507812B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112861670A (zh) * 2021-01-27 2021-05-28 华北电力大学(保定) 一种输电线路金具检测方法及系统
CN113570427A (zh) * 2021-07-22 2021-10-29 上海普洛斯普新数字科技有限公司 一种提取识别线上或系统商品特征信息的系统
CN113628011A (zh) * 2021-08-16 2021-11-09 唯品会(广州)软件有限公司 一种商品搭配方法及装置
CN113763014A (zh) * 2021-01-05 2021-12-07 北京沃东天骏信息技术有限公司 物品共现关系确定方法和装置及判定模型获得方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109522486A (zh) * 2018-11-30 2019-03-26 北京字节跳动网络技术有限公司 用于匹配信息的方法和装置
CN109584006A (zh) * 2018-11-27 2019-04-05 中国人民大学 一种基于深度匹配模型的跨平台商品匹配方法
CN110674305A (zh) * 2019-10-10 2020-01-10 天津师范大学 一种基于深层特征融合模型的商品信息分类方法
CN110827063A (zh) * 2019-10-18 2020-02-21 用友网络科技股份有限公司 一种多策略融合的商品推荐方法、装置、终端及存储介质
US20200134034A1 (en) * 2018-10-30 2020-04-30 International Business Machines Corporation Recommendation systems implementing separated attention on like and dislike items for personalized ranking
CN111179031A (zh) * 2019-12-23 2020-05-19 第四范式(北京)技术有限公司 一种商品推荐模型的训练方法、装置及系统
CN111292164A (zh) * 2020-01-21 2020-06-16 上海风秩科技有限公司 一种商品推荐方法、装置、电子设备及可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200134034A1 (en) * 2018-10-30 2020-04-30 International Business Machines Corporation Recommendation systems implementing separated attention on like and dislike items for personalized ranking
CN109584006A (zh) * 2018-11-27 2019-04-05 中国人民大学 一种基于深度匹配模型的跨平台商品匹配方法
CN109522486A (zh) * 2018-11-30 2019-03-26 北京字节跳动网络技术有限公司 用于匹配信息的方法和装置
CN110674305A (zh) * 2019-10-10 2020-01-10 天津师范大学 一种基于深层特征融合模型的商品信息分类方法
CN110827063A (zh) * 2019-10-18 2020-02-21 用友网络科技股份有限公司 一种多策略融合的商品推荐方法、装置、终端及存储介质
CN111179031A (zh) * 2019-12-23 2020-05-19 第四范式(北京)技术有限公司 一种商品推荐模型的训练方法、装置及系统
CN111292164A (zh) * 2020-01-21 2020-06-16 上海风秩科技有限公司 一种商品推荐方法、装置、电子设备及可读存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
R. HADSELL等: ""Learning Visual Clothing Style with Heterogeneous Dyadic Co-occurrences"", 《2006 IEEE COMPUTER SOCIETY CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR’06)》 *
王庆等: ""基于词共现矩阵的项目关键词词库和关键词语义网络"", 《计算机应用》 *
赵光明: ""基于深度学习的服装搭配推荐算法研究与实现"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
钊魁: ""基于卷积神经网络的电商数据深度挖掘"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
陈再良: ""一种基于向量空间模型的商品分类算法"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
黄旺: ""基于深度学习的衣服搭配算法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113763014A (zh) * 2021-01-05 2021-12-07 北京沃东天骏信息技术有限公司 物品共现关系确定方法和装置及判定模型获得方法和装置
CN112861670A (zh) * 2021-01-27 2021-05-28 华北电力大学(保定) 一种输电线路金具检测方法及系统
CN113570427A (zh) * 2021-07-22 2021-10-29 上海普洛斯普新数字科技有限公司 一种提取识别线上或系统商品特征信息的系统
CN113628011A (zh) * 2021-08-16 2021-11-09 唯品会(广州)软件有限公司 一种商品搭配方法及装置

Also Published As

Publication number Publication date
CN111507812B (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
CN111507812B (zh) 一种基于属性和标题的商品搭配推荐方法及装置
CN111369318B (zh) 一种基于商品知识图谱特征学习的推荐方法及系统
CN107861972B (zh) 一种用户录入商品信息后显示商品全结果的方法及设备
US20200311798A1 (en) Search engine use of neural network regressor for multi-modal item recommendations based on visual semantic embeddings
CN103914492B (zh) 查询词融合方法、商品信息发布方法和搜索方法及系统
CN110110181B (zh) 一种基于用户风格和场景偏好的服装搭配推荐方法
Ghani et al. Text mining for product attribute extraction
KR20190117584A (ko) 스트리밍 비디오 내의 객체를 검출하고, 필터링하고 식별하기 위한 방법 및 장치
CN111784455A (zh) 一种物品推荐方法及推荐设备
CN109146626B (zh) 一种基于用户动态兴趣分析的时尚服装搭配推荐方法
CN112612973B (zh) 结合知识图谱的个性化智能服装搭配推荐方法
KR20200045668A (ko) 스타일 추천 방법, 장치 및 컴퓨터 프로그램
CN107679960A (zh) 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法
CN110909536A (zh) 用于自动生成产品的文章的系统和方法
CN108428166A (zh) 基于卷积神经网络的体貌特征识别分类的服装推荐系统
Zhu et al. New product design with popular fashion style discovery using machine learning
Gu et al. Fashion coordinates recommendation based on user behavior and visual clothing style
CN115641179A (zh) 信息推送方法、装置及电子设备
CN112818088A (zh) 商品搜索数据处理方法、装置、设备及存储介质
Cherednichenko et al. Item Matching Model in E-Commerce: How Users Benefit
US20220100792A1 (en) Method, device, and program for retrieving image data by using deep learning algorithm
CN112184250B (zh) 挽回页的生成方法、装置、存储介质和计算机设备
CN111178974B (zh) 一种提高多平台融合性的方法和装置
Trakulwaranont et al. Personalized Fashion Recommendation using Pairwise Attention
Dalmia et al. Styling with attention to details

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant