CN112396479A - 一种基于知识图谱的服饰搭配推荐方法及系统 - Google Patents

一种基于知识图谱的服饰搭配推荐方法及系统 Download PDF

Info

Publication number
CN112396479A
CN112396479A CN202110073933.3A CN202110073933A CN112396479A CN 112396479 A CN112396479 A CN 112396479A CN 202110073933 A CN202110073933 A CN 202110073933A CN 112396479 A CN112396479 A CN 112396479A
Authority
CN
China
Prior art keywords
vector
commodity
representing
representation
title
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110073933.3A
Other languages
English (en)
Other versions
CN112396479B (zh
Inventor
王思宇
江岭
黄鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Xiaoduo Technology Co ltd
Original Assignee
Chengdu Xiaoduo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Xiaoduo Technology Co ltd filed Critical Chengdu Xiaoduo Technology Co ltd
Priority to CN202110073933.3A priority Critical patent/CN112396479B/zh
Publication of CN112396479A publication Critical patent/CN112396479A/zh
Application granted granted Critical
Publication of CN112396479B publication Critical patent/CN112396479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0254Targeted advertisements based on statistics

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于知识图谱的服饰搭配推荐方法及系统,通过构建的知识图谱进行表示学习,得到知识图谱中各个商品的实体表示向量和类别表示向量;然后通过注意力模型对获取到的查询商品的标题表示向量、候选商品的标题表示向量以及知识图谱中候选商品的实体表示向量和类别表示向量进行计算,得到查询商品的标题表示向量与候选商品各类表示向量的匹配概率;然后通过该匹配概率再进一步分析得到查询商品与候选商品的搭配概率,并将搭配概率最高的商品推荐给客户,提高了服饰搭配推荐的准确率。

Description

一种基于知识图谱的服饰搭配推荐方法及系统
技术领域
本发明涉及电子商务技术领域,具体而言,涉及一种基于知识图谱的服饰搭配推荐方法及系统。
背景技术
目前,服装的搭配主要还是靠人来完成,虽然由人来完成服装组合配置能解决一部分的服装搭配问题,但是这无疑是一件费时且难度较大的工作,同时要求配置人员具有专业搭配知识。因此,如何自动的生成相对合理的商品搭配组合成为目前亟待解决的问题。现有的智能服装搭配推荐方法主要有两种形式:1)基于数据挖掘;2)基于深度学习模型。其中,基于数据挖掘的方法从用户的购买历史中挖掘频繁共现的商品,将这种频繁共现的商品作为搭配商品,例如”T恤和牛仔裤”。该方法是在历史订单数据中进行挖掘,方法简单有效。但对于新上市的商品,该方法无法获得其搭配商品。基于深度学习的方法采用神经网络分别提取两个商品的特征向量然后计算其向量的搭配概率。这类方法的关键在于特征的提取,目前的研究中主要存在三种方法:通过图片提取特征、通过标题提取特征和结合两种方式提取特征。但是,现有方法仍然易受外部噪声的影响,降低了匹配准确率。
发明内容
本发明的目的在于提供一种基于知识图谱的服饰搭配推荐方法及系统,用以实现提高服饰搭配推荐准确率的技术效果。
第一方面,本发明提供了一种基于知识图谱的服饰搭配推荐方法,获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱;
通过TransH模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
获取查询商品的标题表示向量e t1和候选商品的标题表示向量e t2;以及所述候选商品的实体表示向量e e2和类别表示向量e c2
根据所述标题表示向量e t1与所述标题表示向量e t2分析得到注意力向量q t ;根据所述标题表示向量e t1与所述实体表示向量e e2分析得到注意力向量q e ;根据所述标题表示向量e t1与所述类别表示向量e c2分析得到注意力向量q c
根据所述注意力向量q t 、所述注意力向量q e 和所述注意力向量q c 分析所述查询商品与所述候选商品的搭配概率,并将搭配概率最高的商品推荐给用户。
进一步地,所述方法还包括:通过目标函数对所述TransH 模型进行优化,其中目标函数为:
Figure 818623DEST_PATH_IMAGE001
Figure 138746DEST_PATH_IMAGE002
式中,x表示商品知识图谱中正确的实体向量;x'表示商品知识图谱中错误的实体向量;p表示商品知识图谱中的关系向量;o表示商品知识图谱中正确的尾实体向量;o'表示商品知识图谱中错误的尾实体向量;x r 表示x的变换向量;x r '表示x'的变换向量;o r 表示o的变换向量;o r '表示o'的变换向量;w r 表示单位法向量;G表示商品知识图谱中的正确事实;G '表示商品知识图谱中的错误事实,γ k 表示三元组(x r , p , o r )与三元组(x r ', p, o r ' )的间隔;d(x r +p, o r )表示向量x r +po r 的距离;d(x r '+p,o r ' )表示向量x r '+po r '的距离。
进一步地,所述注意力向量q t 的计算方式为:
Figure 568591DEST_PATH_IMAGE003
Figure 75795DEST_PATH_IMAGE004
Figure 350919DEST_PATH_IMAGE005
式中,a t ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的标题表示向量e t2的注意力权重;其中,
Figure 525548DEST_PATH_IMAGE006
通过双向LSTM获得的候选商品的标题表示矩阵
Figure 391873DEST_PATH_IMAGE007
进行平局池化操作后得到,n表示查询商品的标题长度,u表示维度;
Figure 917532DEST_PATH_IMAGE008
表示标题表示向量e t1的行向量代码标题中第j个词的隐形态;
Figure 730767DEST_PATH_IMAGE009
表示样式空间转移矩阵。
进一步地,所述注意力向量q e 的计算方式为:
Figure 228745DEST_PATH_IMAGE010
Figure 531550DEST_PATH_IMAGE011
Figure 482189DEST_PATH_IMAGE012
式中,a e ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的实体表示向量e e2的注意力权重,其中,
Figure 161432DEST_PATH_IMAGE013
从所述商品知识图谱嵌入矩阵中得到;
Figure 513916DEST_PATH_IMAGE014
是样式空间转移矩阵。
进一步地,所述注意力向量q c 的计算方式为:
Figure 190885DEST_PATH_IMAGE015
Figure 425557DEST_PATH_IMAGE016
Figure 580595DEST_PATH_IMAGE017
式中,a c ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的类别表示向量e c2的注意力权重,其中,
Figure 849902DEST_PATH_IMAGE018
从所述商品知识图谱嵌入矩阵中得到;
Figure 697772DEST_PATH_IMAGE019
是样式空间转移矩阵。
进一步地,所述搭配概率的计算方式为:
Figure 357424DEST_PATH_IMAGE020
式中,Q表示所述查询商品与所述候选商品的搭配概率;p t 表示标题表示向量e t2与注意力向量q t 的搭配概率;p e 表示实体表示向量e e2与注意力向量q e 的搭配概率;p c 表示类别表示向量e c2与注意力向量q c 的搭配概率;w T 表示单位向量的转置;b为常数。
进一步地,所述方法还包括:利用构建的训练数据集进行训练,最小化交叉熵损失函数L
Figure 378469DEST_PATH_IMAGE021
式中,Q表示查询商品与候选商品的搭配概率;R表示训练数据集,该训练数据集由若干个商品对构成;r ij 表示所述训练数据集中两个商品的搭配关系,两个商品搭配时r ij =1,两个商品不搭配时r ij =0。
进一步地,所述数据集至少包括中文数据集和英文数据集。
第二方面,本发明提供了一种基于知识图谱的服饰搭配推荐系统,包括:
知识图谱构建模块,获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱;
知识图谱表示学习模块,用于通过TransH 模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
商品表示向量获取模块,用于获取查询商品的标题表示向量e t1和候选商品的标题表示向量e t2;以及所述候选商品的实体表示向量e e2和类别表示向量e c2
注意力分析模块,用于根据所述标题表示向量e t1与所述标题表示向量e t2分析得到注意力向量q t ;根据所述标题表示向量e t1与所述实体表示向量e e2分析得到注意力向量q e ;根据所述标题表示向量e t1与所述类别表示向量e c2分析得到注意力向量q c
搭配推荐模块,根据所述注意力向量q t 、所述注意力向量q e 和所述注意力向量q c 分析所述查询商品与所述候选商品的搭配概率,并将搭配概率最高的商品推荐给用户。
本发明能够实现的有益效果是:本发明提供的基于知识图谱的服饰搭配推荐方法通过构建的知识图谱进行表示学习,得到知识图谱中各个商品的实体表示向量和类别表示向量;然后通过注意力模型对获取到的查询商品的标题表示向量、候选商品的标题表示向量以及知识图谱中候选商品的实体表示向量和类别表示向量进行计算,得到查询商品的标题表示向量与候选商品各类表示向量的匹配概率;然后通过该匹配概率再进一步分析得到查询商品与候选商品的搭配概率,并将搭配概率最高的商品推荐给客户,提高了服饰搭配推荐的准确率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种基于知识图谱的服饰搭配推荐方法流程示意图;
图2为本发明实施例提供的一种基于知识图谱的服饰搭配推荐系统拓扑结构示意图。
图标:10-服饰搭配推荐系统;100-知识图谱构建模块;200-知识图谱表示学习模块;300-商品表示向量获取模块;400-注意力分析模块;500-搭配推荐模块。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参看图1,图1为本发明实施例提供的一种基于知识图谱的服饰搭配推荐方法流程示意图。
经申请人研究发现,近年来随着深度学习的发展,出现了许多基于深度学习的方法,其主要思路是采用神经网络分别提取两个商品的特征向量然后计算其向量的搭配概率。这类方法的关键在于特征的提取,目前的研究中主要存在三种方法:通过图片提取特征,通过标题提取特征和结合两种方式提取特征。但是现有的各种方法的进行服装搭配时易受外部噪声的影响,降低了准确率。所以本发明实施例提供了一种基于知识图谱的服饰搭配推荐方法,其具体内容如下所述。
步骤S101,获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱。
在一种实施方式中,商品以及商品的类别信息构成了商品的基本知识图谱,该图谱中体现了商品间关系;例如两个商品属于同一类,则这个两个商品在知识图谱中会与同一个节点相连接,这两个商品应当具有更高的相似度。同时,用户的购买记录可以体现商品的另一种关系——用户与商品的关系,例如商品总是被某些用户共同购买则这两个商品可能具有某种相同的特征,其相似度也应当更高。因此,本发明提供的实施例按照用户、商品、类别三个实体以及购买和属于两种关系构建商品知识图谱。其中,“购买”关系表示用户与商品之前的关系,而“属于”关系是商品与类别的关系。
步骤S102,通过TransH模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量。
在TransH 模型中,实体和关系被表示为低维稠密向量。本发明把知识图谱表示为三元组(x,p,o)的集合。同时通过目标函数对TransH 模型进行优化。具体地,目标函数的计算方式为:
Figure 439966DEST_PATH_IMAGE022
Figure 521055DEST_PATH_IMAGE023
式中,x表示商品知识图谱中正确的实体向量;x'表示商品知识图谱中错误的实体向量;p表示商品知识图谱中的关系向量;o表示商品知识图谱中正确的尾实体向量;o'表示商品知识图谱中错误的尾实体向量;x r 表示x的变换向量;x r '表示x'的变换向量;o r 表示o的变换向量;o r '表示o'的变换向量;w r 表示单位法向量;G表示商品知识图谱中的正确事实;G '表示商品知识图谱中的错误事实,γ k 表示三元组(x r , p , o r )与三元组(x r ', p, o r ' )的间隔;d(x r +p, o r )表示向量x r +po r 的距离;d(x r '+p,o r ' )表示向量x r '+po r '的距离。
通过TransH 模型对商品知识图谱进行表示学习,即可得到商品知识图谱嵌入矩阵
Figure 668002DEST_PATH_IMAGE024
;其中,
Figure 430422DEST_PATH_IMAGE026
是知识图谱中的所有实体数,
Figure 408742DEST_PATH_IMAGE028
是向量维度。
通过上述方式,一个实体在不同的关系下拥有不同的表示,解决了知识图谱中的一对多和多对一的关系问题。
步骤S103,获取查询商品的标题表示向量e t1和候选商品的标题表示向量e t2;以及所述候选商品的实体表示向量e e2和类别表示向量e c2
在一种实施方式中,本发明提供的实施例通过双向LSTM获取查询商品以及候选商品的标题表示向量;其中,查询商品的标题表示向量为e t1;候选商品的标题表示向量为e t2。候选商品的实体表示向量e e2和类别表示向量e c2可以从商品知识图谱嵌入矩阵
Figure 598415DEST_PATH_IMAGE024
中得到。
具体地,标题表示向量e t1和标题表示向量e t2的获取原理如下:
假定某查询商品q的标题长度为n,其词向量表达式为:
Figure 294976DEST_PATH_IMAGE029
其中,x t 表示句子中第t个词的词向量,词向量维度设置为d w ,因此是S一个n x d w 的矩阵。为了更好的提取特征,本发明的实施例中使用维度为2u的双向LSTM来处理:
Figure 595507DEST_PATH_IMAGE030
Figure 428334DEST_PATH_IMAGE031
最终,通过concatenate函数处理每个
Figure 788908DEST_PATH_IMAGE032
Figure 972765DEST_PATH_IMAGE033
得到当前时间步的隐状态,其维度为2u
Figure 608145DEST_PATH_IMAGE034
通过双向LSTM编码后,该查询商品q的标题表示矩阵表示为:
Figure 498741DEST_PATH_IMAGE035
式中,H q 是一个n x 2u的向量矩阵,即为查询商品q的标题表示向量
Figure 295796DEST_PATH_IMAGE036
。同理可以得到候选商品的向量矩阵
Figure 701369DEST_PATH_IMAGE037
,然后对该向量矩阵H c 进行平均池化操作后得到候选商品的标题表示向量
Figure 609282DEST_PATH_IMAGE038
步骤S104,根据所述标题表示向量e t1与所述标题表示向量e t2分析得到注意力向量q t ;根据所述标题表示向量e t1与所述实体表示向量e e2分析得到注意力向量q e ;根据所述标题表示向量e t1与所述类别表示向量e c2分析得到注意力向量q c
在一种实施方式中,注意力向量
Figure 416701DEST_PATH_IMAGE039
的计算方式为:
Figure 119078DEST_PATH_IMAGE040
Figure 11948DEST_PATH_IMAGE041
Figure 192394DEST_PATH_IMAGE042
式中,a t ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的标题表示向量e t2的注意力权重;其中,
Figure 119898DEST_PATH_IMAGE006
通过双向LSTM获得的候选商品的标题表示矩阵
Figure 789914DEST_PATH_IMAGE043
进行平局池化操作后得到,n表示查询商品的标题长度,u表示维度;
Figure 107763DEST_PATH_IMAGE008
表示标题表示向量e t1的行向量代码标题中第j个词的隐形态;
Figure 154216DEST_PATH_IMAGE044
表示样式空间转移矩阵。
在一种实施方式中,注意力向量
Figure 873911DEST_PATH_IMAGE045
的计算方式为:
Figure 980407DEST_PATH_IMAGE046
Figure 785552DEST_PATH_IMAGE047
Figure 838959DEST_PATH_IMAGE048
式中,a e ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的实体表示向量e e2的注意力权重,其中,
Figure 475476DEST_PATH_IMAGE049
从所述商品知识图谱嵌入矩阵中得到;
Figure 690557DEST_PATH_IMAGE014
是样式空间转移矩阵。
在一种实施方式中,注意力向量q c 的计算方式为:
Figure 779736DEST_PATH_IMAGE050
Figure 371254DEST_PATH_IMAGE051
Figure 65540DEST_PATH_IMAGE052
式中,a c ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的类别表示向量e c2的注意力权重,其中,
Figure 513839DEST_PATH_IMAGE053
从所述商品知识图谱嵌入矩阵中得到;
Figure 293577DEST_PATH_IMAGE019
是样式空间转移矩阵。
步骤S105,根据所述注意力向量q t 、所述注意力向量q e 和所述注意力向量q c 分析所述查询商品与所述候选商品的搭配概率,并将搭配概率最高的商品推荐给用户。
在一种实施方式中,搭配概率的计算方式为:
搭配概率的计算方式为:
Figure 485523DEST_PATH_IMAGE054
式中,Q表示查询商品与候选商品的搭配概率;p t 表示标题表示向量e t2与注意力向量q t 的搭配概率;p e 表示实体表示向量e e2与注意力向量q e 的搭配概率;p c 表示类别表示向量e c2与注意力向量q c 的搭配概率;w T 表示单位向量的转置;b为常数。
在一种实施方式中,本发明实施例提供的方法还包括利用构建的训练数据集进行训练,最小化交叉熵损失函数L
Figure 565475DEST_PATH_IMAGE055
式中,Q表示查询商品与候选商品的搭配概率;R表示训练数据集,该训练数据集由若干个商品对构成;r ij 表示所述训练数据集中两个商品的搭配关系,两个商品搭配时r ij =1,两个商品不搭配时r ij =0。
进一步地,为了提高服装搭配的适用范围,训练数据集至少可以包括中文数据集和英文数据集。通过上述方式,可以进一步提高服装的匹配准确率。
示例性地,本发明实施例选用Taobao数据集和Amazon数据集进行训练,Taobao数据集为中文数据集,其数据主要来自于淘宝网。数据集包括专家标记的搭配数据、商品的信息(包括商品标题,图片,类别等)和用户的购买历史数据。在构建知识图谱时我们选择了有多次购买记录的用户。Amazon数据集为英文数据集,其数据来自于亚马逊购物网站,本发明实施例用该数据集中的‘Also Bought’数据作为搭配商品的来源,将出现在某商品i的‘Also Bought’列表中的但类别与商品i不同的商品作为搭配商品。同时该数据集不包含用户购买历史,但有用户购买后的评论,因此本发明实施例通过用户评论数据获得用户的购买历史。通过处理后最终数据详细见表1。
表1
数据集 搭配集 商品数 订单数 发生多次购买行为用户数
Taobao 205679 60916 3491484 460791
Amazon 377592 64452 124887 52103
在对商品知识图谱进行表示学习时,从用户历史订单中过滤掉只有少量(小于3次)购买记录的用户,最终生成实体和三元组的情况如表2所示。在此三元组的基础上,本发明采用TransH 模型训练工具生成实体的知识图谱嵌入向量,设定向量维度d k =300。
表2
数据集 实体数 关系数 三元组
Taobao 521778 2 2353791
Amazon 116567 2 203611
从人工标记的搭配数据集中生成商品的搭配关系,同时随机的选择未在该商品搭配商品集中的商品作为负样本,负样本与正样本的比例为50:50。然后按照80:10:10的比例将整个数据划分为训练集、测试集和验证集。在模型训练中采用Adam优化器,以及0.001的学习率,词向量维度,d w =300,隐藏层维度u=150,神经网络模型代码采用 Pytorch框架实现。
为了更全面的比较,本发明实施例选择了2类方法作为基线模型:基于图片搭配匹配方法和基于标题的搭配匹配方法。
(1)基于商品图片的方法:
CNN-Image-CM:该模型是一个基于孪生卷积神经网络的端到端的分类模型,采用Google Net作为Taobao数据集的特征提取网络;在Amazon数据集上使用Alex Net作为特征提取网络。
(2)基于商品标题的方法
DCNN-Title-CM: 该方法将两个商品标题送入孪生多层动态卷积网络,该网络采用宽卷积和k-max pooling方法提取特征,再将两个商品的特征映射到新的样式空间计算搭配概率。
TextCNN-Title-CM: 该方法采用TextCNN方法用于提取商品标题文字特征,再将两个商品的特征映射到新的样式空间计算搭配概率。
CNN-Title-CM: 通过孪生卷积神经网络来提取搭配的两个商品的标题特征,然后将特征映射到样式空间,最终计算搭配概率。
LSTM-Title-CM:该方法通过孪生的LSTM来提取标题特征再映射到样式空间计算搭配概率。
通过上述多种方法与本发明的方法进行处理得到的结果如表3所示。
表3
模型 TaoBao Amazon
CNN-Image-CM 0.579 0.9280
CNN-Title-CM 0.8314 0.9506
DCNN-Title-CM 0.8509 0.9513
TextCNN-Title-CM 0.8294 0.9478
LSTM-Title-CM 0.8622 0.9816
Ours(TransH) 0.8796 0.9925
从上述内容可以看出,本发明提供的基于知识图谱的服饰搭配推荐方法在推荐的准确性更高。
请查看图2,图2为本发明实施例提供的一种基于知识图谱的服饰搭配推荐系统拓扑结构示意图。
本发明实施例还提供了一种基于知识图谱的服饰搭配推荐系统10,用于实现上述的方法,包括:
知识图谱构建模块100,获取用户历史订单数据和商品类别信息,并根据用户历史订单数据和商品类别信息构建商品知识图谱;
知识图谱表示学习模块200,用于通过TransH 模型对商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
商品表示向量获取模块300,用于获取查询商品的标题表示向量e t1和候选商品的标题表示向量e t2;以及候选商品的实体表示向量e e2和类别表示向量e c2
注意力分析模块400,用于根据标题表示向量e t1与标题表示向量e t2分析得到注意力向量q t ;根据标题表示向量e t1与实体表示向量e e2分析得到注意力向量q e ;根据标题表示向量e t1与类别表示向量e c2分析得到注意力向量q c
搭配推荐模块500,根据注意力向量q t 、注意力向量q e 和注意力向量q c 分析查询商品与候选商品的搭配概率,并将搭配概率最高的商品推荐给用户。
综上所述,本发明实施例提供一种基于知识图谱的服饰搭配推荐方法及系统,包括获取用户历史订单数据和商品类别信息,并根据用户历史订单数据和商品类别信息构建商品知识图谱;通过TransH模型对商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;获取查询商品的标题表示向量e t1和候选商品的标题表示向量e t2;以及候选商品的实体表示向量e e2和类别表示向量e c2;根据标题表示向量e t1与标题表示向量e t2分析得到注意力向量q t ;根据标题表示向量e t1与实体表示向量e e2分析得到注意力向量q e ;根据标题表示向量e t1与类别表示向量e c2分析得到注意力向量q c ;根据注意力向量q t 、注意力向量q e 和注意力向量q c 分析查询商品与候选商品的搭配概率,并将搭配概率最高的商品推荐给用户。通过上述方式,提高了服饰搭配推荐的准确率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种基于知识图谱的服饰搭配推荐方法,其特征在于,包括:
获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱;
通过TransH模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
获取查询商品的标题表示向量e t1和候选商品的标题表示向量e t2;以及所述候选商品的实体表示向量e e2和类别表示向量e c2
根据所述标题表示向量e t1与所述标题表示向量e t2分析得到注意力向量q t ;根据所述标题表示向量e t1与所述实体表示向量e e2分析得到注意力向量q e ;根据所述标题表示向量e t1与所述类别表示向量e c2分析得到注意力向量q c
根据所述注意力向量q t 、所述注意力向量q e 和所述注意力向量q c 分析所述查询商品与所述候选商品的搭配概率,并将搭配概率最高的商品推荐给用户。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过目标函数对所述TransH模型进行优化,其中目标函数为E
Figure 715939DEST_PATH_IMAGE002
Figure 367500DEST_PATH_IMAGE004
式中,x表示商品知识图谱中正确的实体向量;x'表示商品知识图谱中错误的实体向量;p表示商品知识图谱中的关系向量;o表示商品知识图谱中正确的尾实体向量;o'表示商品知识图谱中错误的尾实体向量;x r 表示x的变换向量;x r '表示x'的变换向量;o r 表示o的变换向量;o r '表示o'的变换向量;w r 表示单位法向量;G表示商品知识图谱中的正确事实;G '表示商品知识图谱中的错误事实,γ k 表示三元组(x r , p , o r )与三元组(x r ', p, o r ' )的间隔;d(x r +p, o r )表示向量x r +po r 的距离;d(x r '+p,o r ' )表示向量x r '+po r '的距离。
3.根据权利要求1所述的方法,其特征在于,所述注意力向量q t 的计算方式为:
Figure 147237DEST_PATH_IMAGE006
Figure 339184DEST_PATH_IMAGE008
Figure 887977DEST_PATH_IMAGE010
式中,a t ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的标题表示向量e t2的注意力权重;其中,
Figure 710440DEST_PATH_IMAGE012
通过双向LSTM获得的候选商品的标题表示矩阵
Figure 774211DEST_PATH_IMAGE014
进行平局池化操作后得到,n表示查询商品的标题长度,u表示维度;
Figure 707531DEST_PATH_IMAGE016
表示标题表示向量e t1的行向量代码标题中第j个词的隐形态;
Figure 376410DEST_PATH_IMAGE018
表示样式空间转移矩阵。
4.根据权利要求3所述的方法,其特征在于,所述注意力向量q e 的计算方式为:
Figure 166512DEST_PATH_IMAGE020
Figure 655262DEST_PATH_IMAGE022
Figure 392274DEST_PATH_IMAGE024
式中,a e ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的实体表示向量e e2的注意力权重,其中,
Figure 712397DEST_PATH_IMAGE026
从所述商品知识图谱嵌入矩阵中得到;
Figure 876662DEST_PATH_IMAGE028
是样式空间转移矩阵。
5.根据权利要求3所述的方法,其特征在于,所述注意力向量q c 的计算方式为:
Figure 915025DEST_PATH_IMAGE030
Figure 190148DEST_PATH_IMAGE032
Figure 568040DEST_PATH_IMAGE034
式中,a c ij 表示第i个查询商品的标题表示向量e t1中的第j个词与候选商品的类别表示向量e c2的注意力权重,其中,
Figure 699944DEST_PATH_IMAGE036
从所述商品知识图谱嵌入矩阵中得到;
Figure 428866DEST_PATH_IMAGE038
是样式空间转移矩阵。
6.根据权利要求1所述的方法,其特征在于,所述搭配概率的计算方式为:
Figure 242101DEST_PATH_IMAGE040
式中,Q表示所述查询商品与所述候选商品的搭配概率;p t 表示标题表示向量e t2与注意力向量q t 的搭配概率;p e 表示实体表示向量e e2与注意力向量q e 的搭配概率;p c 表示类别表示向量e c2与注意力向量q c 的搭配概率;w T 表示单位向量的转置;b为常数。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
利用构建的训练数据集进行训练,最小化交叉熵损失函数L
Figure 536816DEST_PATH_IMAGE042
式中,Q表示查询商品与候选商品的搭配概率;R表示训练数据集,该训练数据集由若干个商品对构成;r ij 表示所述训练数据集中两个商品的搭配关系,两个商品搭配时r ij =1,两个商品不搭配时r ij =0。
8.根据权利要求7所述的方法,其特征在于,所述数据集至少包括中文数据集和英文数据集。
9.一种基于知识图谱的服饰搭配推荐系统,其特征在于,包括:
知识图谱构建模块,获取用户历史订单数据和商品类别信息,并根据所述用户历史订单数据和所述商品类别信息构建商品知识图谱;
知识图谱表示学习模块,用于通过TransH 模型对所述商品知识图谱进行表示学习,得到各个商品的实体表示向量和类别表示向量;
商品表示向量获取模块,用于获取查询商品的标题表示向量e t1和候选商品的标题表示向量e t2;以及所述候选商品的实体表示向量e e2和类别表示向量e c2
注意力分析模块,用于根据所述标题表示向量e t1与所述标题表示向量e t2分析得到注意力向量q t ;根据所述标题表示向量e t1与所述实体表示向量e e2分析得到注意力向量q e ;根据所述标题表示向量e t1与所述类别表示向量e c2分析得到注意力向量q c
搭配推荐模块,根据所述注意力向量q t 、所述注意力向量q e 和所述注意力向量q c 分析所述查询商品与所述候选商品的搭配概率,并将搭配概率最高的商品推荐给用户。
CN202110073933.3A 2021-01-20 2021-01-20 一种基于知识图谱的服饰搭配推荐方法及系统 Active CN112396479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110073933.3A CN112396479B (zh) 2021-01-20 2021-01-20 一种基于知识图谱的服饰搭配推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110073933.3A CN112396479B (zh) 2021-01-20 2021-01-20 一种基于知识图谱的服饰搭配推荐方法及系统

Publications (2)

Publication Number Publication Date
CN112396479A true CN112396479A (zh) 2021-02-23
CN112396479B CN112396479B (zh) 2021-05-25

Family

ID=74625450

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110073933.3A Active CN112396479B (zh) 2021-01-20 2021-01-20 一种基于知识图谱的服饰搭配推荐方法及系统

Country Status (1)

Country Link
CN (1) CN112396479B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113628011A (zh) * 2021-08-16 2021-11-09 唯品会(广州)软件有限公司 一种商品搭配方法及装置
CN114357178A (zh) * 2021-12-08 2022-04-15 阿里巴巴(中国)有限公司 商品标签信息的处理方法、装置、存储介质及系统
CN114491086A (zh) * 2022-04-15 2022-05-13 成都晓多科技有限公司 服饰个性化搭配推荐方法、系统、电子设备及存储介质
CN114490950A (zh) * 2022-04-07 2022-05-13 联通(广东)产业互联网有限公司 编码器模型的训练方法及存储介质、相似度预测方法及系统
CN115936737A (zh) * 2023-03-10 2023-04-07 云筑信息科技(成都)有限公司 一种确定建材真伪的方法和系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105912656A (zh) * 2016-04-07 2016-08-31 桂林电子科技大学 一种商品知识图谱的构建方法
US9948998B1 (en) * 2012-11-01 2018-04-17 Google Llc Providing content related to a selected channel for presentation to a user via a client device
CN109739993A (zh) * 2018-12-06 2019-05-10 深圳云天励飞技术有限公司 服饰知识图谱显示方法、装置、图服务器及存储介质
CN110083242A (zh) * 2019-04-29 2019-08-02 苏州狗尾草智能科技有限公司 虚拟人物换装系统及方法
CN110457508A (zh) * 2019-07-18 2019-11-15 西安工程大学 基于矩阵分解和知识图谱的服装搭配推荐方法
CN111369318A (zh) * 2020-02-28 2020-07-03 安徽农业大学 一种基于商品知识图谱特征学习的推荐方法及系统
CN111402013A (zh) * 2020-06-04 2020-07-10 成都晓多科技有限公司 一种商品搭配推荐方法、系统、装置及存储介质
CN111401748A (zh) * 2020-03-17 2020-07-10 李照宇 一种基于工作场景的穿衣搭配大数据智能评估方法
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9948998B1 (en) * 2012-11-01 2018-04-17 Google Llc Providing content related to a selected channel for presentation to a user via a client device
CN105912656A (zh) * 2016-04-07 2016-08-31 桂林电子科技大学 一种商品知识图谱的构建方法
CN109739993A (zh) * 2018-12-06 2019-05-10 深圳云天励飞技术有限公司 服饰知识图谱显示方法、装置、图服务器及存储介质
CN110083242A (zh) * 2019-04-29 2019-08-02 苏州狗尾草智能科技有限公司 虚拟人物换装系统及方法
CN110457508A (zh) * 2019-07-18 2019-11-15 西安工程大学 基于矩阵分解和知识图谱的服装搭配推荐方法
CN111369318A (zh) * 2020-02-28 2020-07-03 安徽农业大学 一种基于商品知识图谱特征学习的推荐方法及系统
CN111401748A (zh) * 2020-03-17 2020-07-10 李照宇 一种基于工作场景的穿衣搭配大数据智能评估方法
CN111402013A (zh) * 2020-06-04 2020-07-10 成都晓多科技有限公司 一种商品搭配推荐方法、系统、装置及存储介质
CN112232925A (zh) * 2020-11-02 2021-01-15 哈尔滨工程大学 一种融合知识图谱对商品进行个性化推荐的方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MINGDA LI.ETC: ""Enhancing Knowledge Graph Embedding with Relational Constraints"", 《2020 IEEE INTERNATIONAL CONFERENCE ON KNOWLEDGE GRAPH (ICKG)》 *
安元植: ""基于图卷积神经网络的服饰搭配性预测研究"", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 *
陈鑫等: ""商品搭配大数据推荐方法研究综述"", 《计算机工程与科学》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113628011A (zh) * 2021-08-16 2021-11-09 唯品会(广州)软件有限公司 一种商品搭配方法及装置
CN114357178A (zh) * 2021-12-08 2022-04-15 阿里巴巴(中国)有限公司 商品标签信息的处理方法、装置、存储介质及系统
CN114490950A (zh) * 2022-04-07 2022-05-13 联通(广东)产业互联网有限公司 编码器模型的训练方法及存储介质、相似度预测方法及系统
CN114491086A (zh) * 2022-04-15 2022-05-13 成都晓多科技有限公司 服饰个性化搭配推荐方法、系统、电子设备及存储介质
CN115936737A (zh) * 2023-03-10 2023-04-07 云筑信息科技(成都)有限公司 一种确定建材真伪的方法和系统
CN115936737B (zh) * 2023-03-10 2023-06-23 云筑信息科技(成都)有限公司 一种确定建材真伪的方法和系统

Also Published As

Publication number Publication date
CN112396479B (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
CN112396479B (zh) 一种基于知识图谱的服饰搭配推荐方法及系统
US20210191509A1 (en) Information recommendation method, device and storage medium
CN109492157B (zh) 基于rnn、注意力机制的新闻推荐方法及主题表征方法
CN109191240B (zh) 一种进行商品推荐的方法和装置
US8620930B2 (en) Method and system for determining similarity score
CN107679960B (zh) 一种基于服装图像和标签文本双模态内容分析的个性化服装的推荐方法
CN104504055A (zh) 基于图像相似度的商品相似计算方法及商品推荐系统
CN107239993A (zh) 一种基于拓展标签的矩阵分解推荐方法及系统
CN106844407B (zh) 基于数据集相关性的标签网络产生方法和系统
CN103353880B (zh) 一种利用相异度聚类和关联的数据挖掘方法
CN116402063B (zh) 多模态讽刺识别方法、装置、设备以及存储介质
CN108460153A (zh) 一种混合博文与用户关系的社交媒体好友推荐方法
CN108647322B (zh) 基于词网识别大量Web文本信息相似度的方法
CN111611499B (zh) 协同过滤方法、协同过滤装置及系统
CN111460251A (zh) 数据内容个性化推送冷启动方法、装置、设备和存储介质
CN109034960A (zh) 一种基于用户节点嵌入的多属性推断的方法
CN106874503B (zh) 获取推荐数据的方法和装置
CN110096575A (zh) 面向微博用户的心理画像方法
CN113407784A (zh) 一种基于社交网络的社团划分方法、系统及存储介质
CN111429161B (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN110827112A (zh) 深度学习的商品推荐方法、装置、计算机设备及存储介质
CN111353838A (zh) 自动化校验商品类目的方法和装置
CN103577472A (zh) 个人信息获得、推定、商品的分类、检索方法及系统
CN102722578A (zh) 一种基于拉普拉斯正则化无监督的聚类特征选取方法
CN116308685A (zh) 一种基于方面情感预测和协同过滤的产品推荐方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant