CN111369318B - 一种基于商品知识图谱特征学习的推荐方法及系统 - Google Patents
一种基于商品知识图谱特征学习的推荐方法及系统 Download PDFInfo
- Publication number
- CN111369318B CN111369318B CN202010131570.XA CN202010131570A CN111369318B CN 111369318 B CN111369318 B CN 111369318B CN 202010131570 A CN202010131570 A CN 202010131570A CN 111369318 B CN111369318 B CN 111369318B
- Authority
- CN
- China
- Prior art keywords
- commodity
- knowledge graph
- commodities
- recommendation
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000013598 vector Substances 0.000 claims abstract description 44
- 238000004140 cleaning Methods 0.000 claims abstract description 15
- 238000010276 construction Methods 0.000 claims abstract description 14
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000004927 fusion Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 abstract description 5
- 239000002453 shampoo Substances 0.000 description 9
- 230000000694 effects Effects 0.000 description 4
- 208000001840 Dandruff Diseases 0.000 description 2
- 241000255925 Diptera Species 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- -1 correlation Substances 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000005238 degreasing Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 239000000118 hair dye Substances 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于商品知识图谱特征学习的推荐方法及系统,构建关联商品知识图谱,用于解决商品推荐的重复率高和准确率低的问题。本发明提供的方法包括电商平台商品信息的智能获取;商品信息清洗,商品实体和关系智能提取,商品知识图谱构建;利用商品分类结合商品搭配模型对商品知识图谱中的实体进行融合,构建关联商品知识图谱;根据用户的历史购买记录确定待匹配商品实体,连接关联商品知识图谱,进行商品特征学习,降维得到商品实体和关系向量;计算知识图谱匹配到的商品间相关度,对相关度进行排序之后进行商品推荐。本发明通过关联商品知识图谱构建、更新,以及特征学习方法,构建商品推荐系统,实现商品推荐命中率准确率的大幅度提升。
Description
技术领域
本发明涉及计算机软件技术领域,尤其涉及一种基于商品知识图谱特征学习的推荐方法及系统。
背景技术
知识图谱是一种基于图的数据结构,由节点和边组成.在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”,知识图谱是关系的最有效表示方式,并且能够融合多源异构信息.知识图谱表示学习能够将知识图谱嵌入到一个低维空间,可以利用连续数值的向量反映知识图谱的结构特征,这种方法可以高效地计算实体间的关系。
随着电子商务的兴起,电商平台在商品销售领域中占有非常重要的地位。电商平台在商品销售领域中占据非常重要的地位。电商平台相对于传统实体商店具备一个明显优点就是同时展示、销售的商品种类不受限制,但同时,由于电商平台上可选择的商品过多,常常也会给用户在寻找商品时带来烦恼。为此,很多电商平台会主动向用户推荐商品,用户若对推荐的商品感兴趣,便可快速进入购买环节,不仅为用户提供了购物便利,而且增加了电商平台的销售业绩。
目前,商品推荐的方法一般是通过用户历史搜索过的关键词或商品信息在电商平台的数据库中检索,把检索到的商品作为推荐商品推荐给用户。然而,电商平台使用的检索服务一般是基于商品的分类搭建的,这样容易导致最后推荐给用户的商品仅仅是该用户以往购买过的商品,对于普通用户来说再次购买这些商品的可能性较低,使得商品推荐的精确度和成功率较低。
发明内容
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种基于商品知识图谱特征学习的推荐方法及系统,以解决现有技术的不足。
为实现上述目的,本发明提供了一种基于商品知识图谱特征学习的推荐方法,包括以下步骤:
S101、对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱;
S102、创建商品搭配模型,将构建好的商品知识图谱融合商品搭配模型,生成关联商品知识图谱;
S103、提取关联商品知识图谱特征,使用知识图谱特征学习算法进行学习从而得到基于商品推荐主题的实体和关系向量;
S104、构建推荐模型,通过向量的余弦相似度来计算商品实体之间的相关性,从而根据结果对用户进行商品推荐。
进一步地,所述步骤S101中对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱具体为:对电商网站商品数据采集,包括商品的名称、销量、分类、价格、评价;对电商网站商品数据进行清洗为:根据商品的名称和评论进行分词,建立专有词字典,对上述分词结果提取关键词,从关键词里找实体商品和关系,建立商品三元组<商品A,关系,商品A的属性>,生成csv表格,导入到neo4j中生成原始商品知识图谱。
进一步地,所述步骤S102中创建商品搭配模型,将构建好的商品知识图谱融合商品搭配模型,生成关联商品知识图谱,具体为:
201、根据网站中的商品分类构建商品搭配模型;
202、根据商品间关联度的高低,设置相应的权重值;
203、根据用户购买情况和商品促销情况及时更新商品之间的权重值;
204、将商品搭配模型和基本商品知识图谱融合,形成关联商品知识图谱。
进一步地,所述步骤S103中提取关联商品知识图谱特征,具体为:
301、实体连接:即从历史购买记录中发现商品字典里的词汇,并与关联商品知识图谱中的实体进行匹配;
302、提取商品知识图谱:根据商品字典匹配到的实体,在关联商品知识图谱中抽取子图;
303、关联商品知识图谱特征学习:使用知识图谱特征学习算法进行学习得到实体和关系向量。
进一步地,所述步骤S104中构建推荐模型为:计算用户历史购买过的商品A与搭配模型匹配到的商品B的相似度,从而根据相似度的大小推荐商品;这里用到的计算商品相似度的算法是向量的余弦相似度来计算它们之间的相关性similarity,计算公式为:
一种基于商品知识图谱特征学习的推荐系统,包括:
商品知识图谱构建模块,用于对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱;
关联商品知识图谱生成模块,用于创建商品搭配模型,将构建好的商品知识图谱融合商品搭配模型,生成关联商品知识图谱;
关联商品知识图谱特征提取模块,用于提取关联商品知识图谱特征,使用知识图谱特征学习算法进行学习从而得到基于商品推荐主题的实体和关系向量;
推荐模型构建模块,用于构建推荐模型,通过向量的余弦相似度来计算商品实体之间的相关性,从而根据结果对用户进行商品推荐。
进一步地,所述商品知识图谱构建模块,对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱,具体为:对电商网站商品数据采集,包括商品的名称、销量、分类、价格、评价;对电商网站商品数据进行清洗为:根据商品的名称和评论进行分词,建立专有词字典,对上述分词结果提取关键词,从关键词里找实体商品和关系,建立商品三元组<商品A,关系,商品A的属性>,生成csv表格,导入到neo4j中生成原始商品知识图谱。
进一步地,所述关联商品知识图谱生成模块包括:
商品搭配模型构建子模块,用于根据网站中的商品分类构建商品搭配模型;
权重值设置子模块,用于根据商品间关联度的高低,设置相应的权重值;
权重值更新子模块,用于根据用户购买情况和商品促销情况及时更新商品之间的权重值;
融合模块,用于将商品搭配模型和基本商品知识图谱融合,形成关联商品知识图谱。
进一步地,所述关联商品知识图谱特征提取模块包括:
实体连接子模块,从历史购买记录中发现商品字典里的词汇,并与关联商品知识图谱中的实体进行匹配;
商品知识图谱提取模块,根据商品字典匹配到的实体,在关联商品知识图谱中抽取子图;
关联商品知识图谱特征学习子模块,使用知识图谱特征学习算法进行学习得到实体和关系向量。
进一步地,所述推荐模型构建模块,用于计算用户历史购买过的商品A与搭配模型匹配到的商品B的相似度,从而根据相似度的大小推荐商品;这里用到的计算商品相似度的算法是向量的余弦相似度来计算它们之间的相关性similarity,计算公式为:
本发明的有益效果是:
本发明提供的方法包括电商平台商品信息的智能获取;商品信息清洗,商品实体和关系智能提取,商品知识图谱构建;利用商品分类结合商品搭配模型对商品知识图谱中的实体进行融合,构建关联商品知识图谱;根据用户的历史购买记录确定待匹配商品实体,连接关联商品知识图谱,进行商品特征学习,降维得到商品实体和关系向量;计算知识图谱匹配到的商品间相关度,对相关度进行排序之后进行商品推荐。本发明通过关联商品知识图谱构建、更新,以及特征学习方法,构建商品推荐系统,可实现用户已购商品的关联商品的潜在需求挖掘,进而解决目前商品推荐系统在命中率和召回率低下问题,实现商品推荐命中率准确率的大幅度提升。
以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1为本发明实施例提供的基于知识图谱特征商品推荐系统的流程图;
图2为本发明实施例提供的基于知识图为了更清楚地说明本发明实施例中的技术方案,附图1-5是本发明的一些实施实例,可以根据这些附图实例拓展得到其他实例的实施方案。
图3为本发明实施例提供的商品实体融合流程示意图;
图4为本发明实施例提供的提取关联商品知识图谱特征的流程图;
图5为本发明的方法所构建的关于防滑垫的局部知识图谱的示例。
具体实施方式
本发明提出了一种基于商品知识图谱特征学习的推荐方法及系统,可实现用户已购商品的关联商品的潜在需求挖掘,进而解决目前商品推荐系统在命中率和召回率低下问题,使得商品推荐的精确度和成功率大幅度提升。
第一方面,本发明提供了一种商品推荐系统,包括:构建商品关联知识图谱,商品推荐模块。上述构建商品搭配知识图谱模块包括以下步骤:
第一步是数据采集与清洗模块,商品网站的每个商品页面中通常存在大量的实体,实体间的语义关系可以有效地扩展为商品搭配。数据采集是从商品网页上爬取所需要的信息,主要有商品的名称,商品的类别,商品的价格,商品的评论等。将爬取到的数据进行文本预处理(包括分词,标记词性,去噪等),根据商品词典,提取出实体和关系。
第二步是根据提取的实体和关系构建基本商品知识图谱,将商品知识图谱存于neo4j中。商品知识图谱是一个由三元组<头节点,关系,尾结点>组成的异构网络,也可以说这个三元组是<实体a,关系,实体b>,例如:<衣架a,属于,生活用品>;<被套c,定价为,价格>等等。
第三步是利用商品关联模型,通过商品之间的关联度来对知识图谱中的节点间连线权重进行适时调整,动态反映出商品与商品之间的关联度。商品之间的关联度越高,节点间分配到的权重越大。反之,节点之间的连接权重越小。在基本商品知识图谱上补充得出关联商品知识图谱,存入neo4j图数据库。用户对于某些商品的潜在购买可能性与曾经购买的商品有较大的相关性,例如,某用户买了被套,则蚊帐、枕头等与被套等使用关联度较高的产品,具有很高的潜在购买可能性,然而传统的推荐算法,通常只会给用户推荐已经买过的被套类商品类型,而不会推荐蚊帐、枕头,而被套对于普通用户来说再次购买这些商品的可能性较低,使得商品推荐的准确率和成功率较低。因此,本发明引入商品搭配模型的商品知识图谱可以有效解决此类问题,从而使得推荐系统能够提高准确率和成功率。如<被套,搭配,枕头>;<被套,搭配,被芯>等是本发明中的知识图谱三元组的典型例子。
上述构建商品推荐模块是结合知识图谱特征学习,利用TransE和余弦向量算法进行商品推荐。
第二方面,本发明提供了一种推荐商品的方法,该方法有两步:
第一步是提取关联商品知识图谱特征,具体步骤包括:
A1、实体连接。即从历史购买记录中发现商品字典里的词汇,并与关联商品知识图谱的实体进行匹配;
A2、抽取关联商品知识图谱。根据所有匹配到的实体,在关联商品知识图谱中抽取子图。子图的大小会影响后续算法的运行时间和效果:越大的子图通常会学习到更好的特征,但是所需的运行时间越长;
A3、关联商品知识图谱特征学习。使用知识图谱特征学习算法进行学习得到实体和关系向量。在本发明中使用TransE算法进行关联商品知识图谱特征学习,将商品实体映射到K维空间,在K维向量空间中,几何上越接近的实体相关性越大,则商品关联度越高。
第二步是构建商品推荐模型,在A3的基础上得到实体向量,利用余弦相似度来计算实体之间的相关性,对计算结果进行排序,根据排序结果对用户进行商品推荐。
知识图谱特征学习模块和推荐系统模块相互独立。在真实场景中,特别是知识图谱很大的情况下,进行一次知识图谱特征学习的时间开销会很大,而一般而言,知识图谱远没有推荐模块更新地快。因此我们可以先通过一次训练得到实体和关系向量,以后每次推荐系统模块需要更新时都可以直接使用这些向量作为输入,而无需重新训练。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行具体描述:
在实例中,如图2所示,一种基于商品知识图谱特征学习的推荐方法,包括如下步骤:
S101、数据采集与清洗,提取实体和关系,构建商品知识图谱。
本实施例中,提前收集了某电商网站的所有商品的数据,其中主要包括商品的名称,商品的价格,商品的分类,商品的评论等。例如某个电商平台上某款洗发水的名称为“海飞丝洗发水净爽去油男士去屑洗190ml清爽持久控油”,价格为“29.90元”,分类是“家居”,商品的评论有“速度快了好多,今天买,第二天就到,我买了两包化妆棉,性价比很高,可以用好久。我还买了配套的护发素”。
针对收集到的商品的信息,根据商品词典,进行命名实体识别,提取实体与关系,构建基础商品知识图谱。由上例可以提取的知识图谱的三元组有<洗发水,品名,海飞丝>,<洗发水,分类,家居>,<洗发水,功能,净爽去油男士去屑>,<洗发水,容量,190ml>等,将数据存储到图数据库neo4j中。
S102、融合商品实体,生成关联商品知识图谱。
融合实体在本实施例中,指的是对基础商品知识图谱和商品搭配模型进行实体融合。其中“商品搭配模型”是本发明自己命名的,不是传统定义上的组合商品,组合商品是几件东西同时购买有优惠,而本发明中的商品搭配是为用户推荐已经购买过的商品的搭配商品。商品搭配模型本身也是一个商品知识图谱,是将商品作为节点,两个商品之间有联系则将两者进行连接。通过给商品搭配模型中的节点间分配不同的权重可以体现不同物品的关联度的差异。
商品搭配模型通过商品类型之间的相似度来对知识图谱中的节点间连接权重进行动态修改,能够反映出商品与商品之间的关联度。商品之间的关联度越高,节点间分配到的权重越大。反之,节点之间的连接权重越小。将新的节点添加到原有的知识图谱中,从而构建出关联商品知识图谱,使得商品知识图谱更加完善。为了便于理解,如图3所示,进一步地,所述步骤S102可以包括:
201、根据网站中的商品分类构建商品搭配模型;本步骤是要自己构建商品搭配模型的,和步骤S101类似,不同的是实体和关系的选择规则不同。在本步骤中,主要依靠商品的分类这个信息,商品分类是我们之前收集到的商品信息中的一个特征。实体也就是商品搭配模型中的节点主要是商品,同一类商品之间有连接线。
202、根据商品间关联度的高低,设置相应的权重值;本步骤是根据商品间关联度的高低,设置对应关系相应的权重值。刚开始设置权重值时,主要是根据商品的分类和历史购买来设置权重值。
203、根据用户购买情况和商品促销情况及时更新商品之间的权重值;本步骤是根据实际情况更改权重值,实际情况是变化的,所以会设置时间段,一段时间重新设置权重值,权重值是两个商品节点之间连接线上的值,可以直接反应两个商品之间的关联度。
204、将商品搭配模型和基本商品知识图谱融合,形成关联商品知识图谱;本步骤主要是将构建好的商品搭配模型加入到基本商品知识图谱中,进行实体融合,从而形成新的带商品搭配模型的知识图谱,这也是本发明的关键技术点和创新点。即原有的商品知识图谱中没有关联的商品,将商品搭配模型融入到原有的商品知识图谱中,就会出现新的关联商品的知识图谱。例如上面洗发水的例子,就可以新增加一些知识图谱的三元组<洗发水,相关度,护发素>,<护发素,相关度,护发梳>,<洗发水,相关度,染发剂>等。
S103、提取关联商品知识图谱特征。在本发明中我们使用依次学习,即先使用商品知识图谱特征学习得到实体向量和关系向量,然后将这些低维向量引入商品推荐系统中。为了便于理解,如图4所示,进一步地,提取商品知识图谱特征的步骤S103可以包括:
301、实体连接:即从历史购买记录中发现商品字典里的词汇,并与关联商品知识图谱中的实体进行匹配;本步骤将用户历史购买的商品名称进行hanlp分词,举例说明:“PVC浴缸防滑垫加长款地垫带吸盘环保塑料浴室防滑垫”,利用此分词可以为“PVC/nx,浴缸/n,防滑垫/nz,加长/v,款/q,地垫/nz,带/v,吸盘/n,环保/n,塑料/n,浴室/n,防滑垫/nz”,其中建立自定义商品字典,标记词性为nz,提取nz词性的词语作为实体名称,本实例中提取到了“防滑垫”这一商品名。
302、提取商品知识图谱:根据商品字典匹配到的实体,在关联商品知识图谱中抽取子图;本步骤是在原始的商品知识图谱中抽取的子图,子图主要是上个步骤中提取到的nz词性的实体为圆心,与它有连线的实体都留下,没有连线的实体都删除,形成新的以已购买过的商品为圆心的商品知识图谱子图。子图的大小会影响后续算法的运行时间和效果:越大的子图通常会学习到更好的特征,但是所需的运行时间越长。所以要结合现实情况进行考虑。图5是关于防滑垫的一个小的知识图谱的例子。
303、关联商品知识图谱特征学习:使用知识图谱特征学习算法进行学习得到实体和关系向量;本步骤这里用到的知识图谱特征学习算法是TransE算法,即将知识图谱里的三元组向量化,向量化的目的是将实体和关系映射到低维连续的向量空间,方便接下来的计算。
TransE的直观含义,就是TransE基于实体和关系的分布式向量表示,将每个三元组实例(实体a,关系,实体b)中的关系看作从实体a到实体b的翻译(其实就是向量相加),通过不断调整向量h、向量r和向量t(实体a、关系和实体b的向量),使(h+r)尽可能与向量t相等,即h+r=t。如果是一个错误的三元组,那么它们特征之间就不满足这种关系。经过训练找到满足条件的特征实体向量。
S104、构建推荐模型。这里主要是计算用户历史购买过的商品A与搭配模型匹配到的商品B的相似度,从而根据相似度的大小推荐商品。这里用到的计算商品相似度的算法是向量的余弦相似度来计算它们之间的相关性similarity
余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,反之这两个向量越不相似。对结果进行排序,给用户推荐相似度高的相关商品。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (2)
1.一种基于商品知识图谱特征学习的推荐方法,其特征在于,包括以下步骤:
S101、对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱;
S102、创建商品搭配模型,将构建好的商品知识图谱融合商品搭配模型,生成关联商品知识图谱;
S103、提取关联商品知识图谱特征,使用知识图谱特征学习算法进行依次学习从而得到基于商品推荐主题的实体和关系向量;
S104、构建推荐模型,通过向量的余弦相似度来计算商品实体之间的相关性,从而根据结果对用户进行商品推荐;
所述步骤S101中对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱具体为:对电商网站商品数据采集,包括商品的名称、销量、分类、价格、评价;对电商网站商品数据进行清洗为:根据商品的名称和评论进行分词,建立专有词字典,对上述分词结果提取关键词,从关键词里找实体商品和关系,建立商品三元组<商品A,关系,商品A的属性>,生成csv表格,导入到neo4j中生成原始商品知识图谱;
所述步骤S102中创建商品搭配模型,将构建好的商品知识图谱融合商品搭配模型,生成关联商品知识图谱,具体为:
根据网站中的商品分类构建商品搭配模型;
根据商品间关联度的高低,设置相应的权重值;
根据用户购买情况和商品促销情况及时更新商品之间的权重值;
201、根据网站中的商品分类构建商品搭配模型;
202、根据商品间关联度的高低,设置相应的权重值;
203、根据用户购买情况和商品促销情况及时更新商品之间的权重值;
204、将商品搭配模型和基本商品知识图谱融合,形成关联商品知识图谱;
所述步骤S103中提取关联商品知识图谱特征,具体为:
301、实体连接:即从历史购买记录中发现商品字典里的词汇,并与关联商品知识图谱中的实体进行匹配;
302、提取商品知识图谱:根据商品字典匹配到的实体,在关联商品知识图谱中抽取子图;
303、关联商品知识图谱特征学习:使用知识图谱特征学习算法进行学习得到实体和关系向量;
所述步骤S104中构建推荐模型为:计算用户历史购买过的商品A与搭配模型匹配到的商品B的相似度,从而根据相似度的大小推荐商品;这里用到的计算商品相似度的算法是向量的余弦相似度来计算它们之间的相关性similarity,计算公式为:
2.一种基于商品知识图谱特征学习的推荐系统,其特征在于,包括:
商品知识图谱构建模块,用于对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱;
关联商品知识图谱生成模块,用于创建商品搭配模型,将构建好的商品知识图谱融合商品搭配模型,生成关联商品知识图谱;
关联商品知识图谱特征提取模块,用于提取关联商品知识图谱特征,使用知识图谱特征学习算法进行学习从而得到基于商品推荐主题的实体和关系向量;
推荐模型构建模块,用于构建推荐模型,通过向量的余弦相似度来计算商品实体之间的相关性,从而根据结果对用户进行商品推荐;
所述商品知识图谱构建模块,对电商网站商品数据采集与清洗,提取商品实体和关系,构建商品知识图谱,具体为:对电商网站商品数据采集,包括商品的名称、销量、分类、价格、评价;对电商网站商品数据进行清洗为:根据商品的名称和评论进行分词,建立专有词字典,对上述分词结果提取关键词,从关键词里找实体商品和关系,建立商品三元组<商品A,关系,商品A的属性>,生成csv表格,导入到neo4j中生成原始商品知识图谱;
所述关联商品知识图谱生成模块包括:
商品搭配模型构建子模块,用于根据网站中的商品分类构建商品搭配模型;
权重值设置子模块,用于根据商品间关联度的高低,设置相应的权重值;
权重值更新子模块,用于根据用户购买情况和商品促销情况及时更新商品之间的权重值;
融合模块,用于将商品搭配模型和基本商品知识图谱融合,形成关联商品知识图谱;
所述关联商品知识图谱特征提取模块包括:
实体连接子模块,从历史购买记录中发现商品字典里的词汇,并与关联商品知识图谱中的实体进行匹配;
商品知识图谱提取模块,根据商品字典匹配到的实体,在关联商品知识图谱中抽取子图;
关联商品知识图谱特征学习子模块,使用知识图谱特征学习算法进行学习得到实体和关系向量;
所述推荐模型构建模块,用于计算用户历史购买过的商品A与搭配模型匹配到的商品B的相似度,从而根据相似度的大小推荐商品;这里用到的计算商品相似度的算法是向量的余弦相似度来计算它们之间的相关性similarity,计算公式为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010131570.XA CN111369318B (zh) | 2020-02-28 | 2020-02-28 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010131570.XA CN111369318B (zh) | 2020-02-28 | 2020-02-28 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111369318A CN111369318A (zh) | 2020-07-03 |
CN111369318B true CN111369318B (zh) | 2024-02-02 |
Family
ID=71212348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010131570.XA Active CN111369318B (zh) | 2020-02-28 | 2020-02-28 | 一种基于商品知识图谱特征学习的推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111369318B (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112070511A (zh) * | 2020-08-12 | 2020-12-11 | 上海连尚网络科技有限公司 | 一种检测不合格商品的方法与设备 |
CN112015911B (zh) * | 2020-08-24 | 2021-07-20 | 上海松鼠课堂人工智能科技有限公司 | 一种海量知识图谱检索的方法 |
CN112069388B (zh) * | 2020-09-02 | 2023-07-21 | 上海风秩科技有限公司 | 实体推荐方法、系统、计算机设备和计算机可读存储介质 |
CN112131882B (zh) * | 2020-09-30 | 2024-02-13 | 绿盟科技集团股份有限公司 | 一种多源异构网络安全知识图谱构建方法及装置 |
CN112256952A (zh) * | 2020-10-22 | 2021-01-22 | 上海适享文化传播有限公司 | 基于图数据库技术满足电商场景化搜索的方法 |
CN112308666A (zh) * | 2020-10-26 | 2021-02-02 | 福建菩泰网络科技有限公司 | 一种网上商城商品的推荐方法及其系统 |
CN112508636B (zh) * | 2020-11-03 | 2023-01-24 | 上海财经大学 | 一种护肤品推荐方法 |
CN112417167A (zh) * | 2020-11-20 | 2021-02-26 | 中国平安人寿保险股份有限公司 | 保险知识图谱的构建方法、装置、计算机设备及存储介质 |
CN112528153B (zh) * | 2020-12-22 | 2024-03-08 | 北京百度网讯科技有限公司 | 内容推荐方法、装置、设备、存储介质以及程序产品 |
CN112487199B (zh) * | 2020-11-24 | 2022-02-18 | 杭州电子科技大学 | 一种基于用户购买行为的用户特征预测方法 |
CN112395429A (zh) * | 2020-12-02 | 2021-02-23 | 上海三稻智能科技有限公司 | 基于图神经网络的hs编码判定、推送、应用方法、系统及存储介质 |
CN112541072B (zh) * | 2020-12-08 | 2022-12-02 | 成都航天科工大数据研究院有限公司 | 一种基于知识图谱的供需信息推荐方法及系统 |
CN112612973B (zh) * | 2020-12-31 | 2022-03-22 | 重庆邮电大学 | 结合知识图谱的个性化智能服装搭配推荐方法 |
CN112800207B (zh) * | 2021-01-13 | 2022-05-13 | 桂林电子科技大学 | 一种商品信息推荐方法、装置及存储介质 |
CN112396479B (zh) * | 2021-01-20 | 2021-05-25 | 成都晓多科技有限公司 | 一种基于知识图谱的服饰搭配推荐方法及系统 |
CN112989030A (zh) * | 2021-03-15 | 2021-06-18 | 中国美术学院 | 一种相似产品关系的可视化方法和系统 |
CN113139839A (zh) * | 2021-05-14 | 2021-07-20 | 广东工业大学 | 一种基于微信小程序的购物优惠券推送系统和方法 |
CN113220905A (zh) * | 2021-05-27 | 2021-08-06 | 哈尔滨理工大学 | 一种融合知识图谱的服务推荐方法 |
CN114693389B (zh) * | 2021-08-12 | 2024-05-28 | 山东浪潮爱购云链信息科技有限公司 | 一种针对采购商的线上寻源方法、设备及介质 |
CN114064883B (zh) * | 2022-01-17 | 2022-04-29 | 北京融华汇投资管理有限公司 | 基于精准算法和大数据的医药知识快速学习系统及方法 |
CN114491086A (zh) * | 2022-04-15 | 2022-05-13 | 成都晓多科技有限公司 | 服饰个性化搭配推荐方法、系统、电子设备及存储介质 |
CN116308683B (zh) * | 2023-05-17 | 2023-08-04 | 武汉纺织大学 | 基于知识图谱的服装品牌定位推荐方法、设备及存储介质 |
CN116823321B (zh) * | 2023-07-06 | 2024-02-06 | 青岛酒店管理职业技术学院 | 一种电商用经济管理数据分析方法及系统 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103593792A (zh) * | 2013-11-13 | 2014-02-19 | 复旦大学 | 一种基于中文知识图谱的个性化推荐方法与系统 |
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
US9948998B1 (en) * | 2012-11-01 | 2018-04-17 | Google Llc | Providing content related to a selected channel for presentation to a user via a client device |
CN109063188A (zh) * | 2018-08-28 | 2018-12-21 | 国信优易数据有限公司 | 一种实体推荐方法和装置 |
CN109816482A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 电商平台的知识图谱构建方法、装置、设备及存储介质 |
CN110458641A (zh) * | 2019-06-28 | 2019-11-15 | 苏宁云计算有限公司 | 一种电商推荐方法及系统 |
CN110457508A (zh) * | 2019-07-18 | 2019-11-15 | 西安工程大学 | 基于矩阵分解和知识图谱的服装搭配推荐方法 |
CN110489540A (zh) * | 2019-08-21 | 2019-11-22 | 合肥天源迪科信息技术有限公司 | 一种基于知识图谱的学习内容推荐方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10909601B2 (en) * | 2014-12-11 | 2021-02-02 | Facebook, Inc. | Providing product advice recommendation |
-
2020
- 2020-02-28 CN CN202010131570.XA patent/CN111369318B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9948998B1 (en) * | 2012-11-01 | 2018-04-17 | Google Llc | Providing content related to a selected channel for presentation to a user via a client device |
CN103593792A (zh) * | 2013-11-13 | 2014-02-19 | 复旦大学 | 一种基于中文知识图谱的个性化推荐方法与系统 |
CN107729444A (zh) * | 2017-09-30 | 2018-02-23 | 桂林电子科技大学 | 一种基于知识图谱的个性化旅游景点推荐方法 |
CN109063188A (zh) * | 2018-08-28 | 2018-12-21 | 国信优易数据有限公司 | 一种实体推荐方法和装置 |
CN109816482A (zh) * | 2019-01-04 | 2019-05-28 | 平安科技(深圳)有限公司 | 电商平台的知识图谱构建方法、装置、设备及存储介质 |
CN110458641A (zh) * | 2019-06-28 | 2019-11-15 | 苏宁云计算有限公司 | 一种电商推荐方法及系统 |
CN110457508A (zh) * | 2019-07-18 | 2019-11-15 | 西安工程大学 | 基于矩阵分解和知识图谱的服装搭配推荐方法 |
CN110489540A (zh) * | 2019-08-21 | 2019-11-22 | 合肥天源迪科信息技术有限公司 | 一种基于知识图谱的学习内容推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111369318A (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111369318B (zh) | 一种基于商品知识图谱特征学习的推荐方法及系统 | |
CN108898459B (zh) | 一种商品推荐方法及装置 | |
CN111784455B (zh) | 一种物品推荐方法及推荐设备 | |
CN111062775A (zh) | 一种基于注意力机制的推荐系统召回方法 | |
CN112612973B (zh) | 结合知识图谱的个性化智能服装搭配推荐方法 | |
CN109584006B (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
CN111507812B (zh) | 一种基于属性和标题的商品搭配推荐方法及装置 | |
CN108428166A (zh) | 基于卷积神经网络的体貌特征识别分类的服装推荐系统 | |
JP2014115951A (ja) | 属性情報最適化装置、属性情報最適化プログラム及び属性情報の最適化方法、並びにレコメンド対象選択装置、レコメンド対象選択プログラム及びレコメンド対象の選択方法 | |
Wakita et al. | Toward fashion-brand recommendation systems using deep-learning: Preliminary analysis | |
CN115641179A (zh) | 信息推送方法、装置及电子设备 | |
Banerjee et al. | Boxrec: recommending a box of preferred outfits in online shopping | |
Ghani et al. | Using text mining to infer semantic attributes for retail data mining | |
KR20220001617A (ko) | 고객 빅데이터를 활용한 상품 추천 방법, 장치 및 시스템 | |
Zhang et al. | Garment recommendation in an e-shopping environment by using a Markov Chain and Complex Network integrated method | |
Lomas et al. | A systematic literature review of artificial intelligence in fashion retail B2C | |
Zhang et al. | Clothes collocation recommendations by compatibility learning | |
Jain et al. | E-commerce product recommendation based on product specification and similarity | |
TW200907841A (en) | A method and system for generating an ordered list | |
Zhou et al. | Fashion recommendations using text mining and multiple content attributes | |
Baral et al. | PERS: A personalized and explainable POI recommender system | |
Ahsan et al. | Complementary Recommendations Using Deep Multi-modal Embeddings For Online Retail | |
Guo et al. | A picture is worth a thousand words: Introducing visual similarity into recommendation | |
Hashimoto et al. | A visualization interface for exploring similar brands on a fashion e-commerce platform | |
Malik et al. | Applying data mining for clustering shoppers based on store loyalty |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |