CN111260428A - 一种商品推荐方法和装置 - Google Patents

一种商品推荐方法和装置 Download PDF

Info

Publication number
CN111260428A
CN111260428A CN201811465546.9A CN201811465546A CN111260428A CN 111260428 A CN111260428 A CN 111260428A CN 201811465546 A CN201811465546 A CN 201811465546A CN 111260428 A CN111260428 A CN 111260428A
Authority
CN
China
Prior art keywords
words
word
user
feature
commodity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811465546.9A
Other languages
English (en)
Inventor
左丽丽
肖宁
毛文辉
王娜
高云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201811465546.9A priority Critical patent/CN111260428A/zh
Publication of CN111260428A publication Critical patent/CN111260428A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种商品推荐方法和装置,该方法包括:针对任一用户,获取该用户在购物网站的日志数据;并提取该用户最感兴趣的特征词,所述特征词包括:品牌词,和/或品类词;在预设词向量库中匹配所述特征词的目标词向量;当匹配到目标词向量时,分别计算该目标词向量与预设词向量库中其它特征词的词向量的相似度;确定相似度最高的词向量对应的特征词作为扩展词;根据该用户最感兴趣的特征词,以及获取的扩展词确定要推荐的商品,并输出给所述用户。该方法能够提高设备处理能力,以及用户体验。

Description

一种商品推荐方法和装置
技术领域
本发明涉及互联网技术领域,特别涉及一种商品推荐方法和装置。
背景技术
通常购物网站会在设置一些专栏、频道、或在用户浏览商品的过程中向用户展示推荐的商品,如长期浏览某知名品牌商品,表示该用户对某一品牌偏好或品类偏好,可以为用户推荐该品牌或品类,以及与该品类或品牌相似或相关的商品。
在现有实现中,主要根据人工经验总结来进行推荐,这样的实现方式耗费人力成本,且主观性较大,不同的人来处理推荐结果可能是不一样的。
发明内容
有鉴于此,本申请提供一种商品推荐方法和装置,能够提高设备处理能力,以及用户体验。
为解决上述技术问题,本申请的技术方案是这样实现的:
一种商品推荐方法,该方法包括:
针对任一用户,获取该用户在购物网站的日志数据;并提取该用户最感兴趣的特征词,所述特征词包括:品牌词,和/或品类词;
在预设词向量库中匹配所述特征词的目标词向量;
当匹配到目标词向量时,分别计算该目标词向量与预设词向量库中其它特征词的词向量的相似度;
确定相似度最高的词向量对应的特征词作为扩展词;
根据该用户最感兴趣的特征词,以及获取的扩展词确定要推荐的商品,并输出给所述用户。
一种商品推荐装置,该装置包括:获取单元、提取单元、匹配单元、处理单元、确定单元和输出单元;
所述获取单元,用于针对任一用户,获取该用户在购物网站的日志数据;
所述提取单元,用于提取所述获取单元获取的日志数据中该用户最感兴趣的特征词,所述特征词包括:品牌词,和/或品类词;
所述匹配单元,用于在预设词向量库中匹配所述提取单元提取的特征词的目标词向量;
所述处理单元,用于当所述匹配单元匹配到目标词向量时,分别计算该目标词向量与预设词向量库中其它特征词的词向量的相似度;
所述确定单元,用于确定所述处理单元中相似度最高的词向量对应的特征词作为扩展词;根据该用户最感兴趣的特征词,以及获取的扩展词确定要推荐的商品;
所述输出单元,用于将所述确定单元确定的商品输出给所述用户。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述商品推荐的方法。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述商品推荐的方法。
由上面的技术方案可知,本申请中通过用户在购物网站中的日志数据,获取该用户最感兴趣的特征词,并且在预设词向量库中存在该特征词的目标词向量时,确定词向量与该特征词相似度最大的特征词,根据两个特征词确定要推荐的商品推荐给用户。该方案能够提高设备处理能力,以及用户体验。
附图说明
图1为本申请实施例中商品推荐流程示意图;
图2为本申请实施例中应用于上述技术的装置结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图并举实施例,对本发明的技术方案进行详细说明。
本申请实施例中提供一种商品推荐方法,通过用户在购物网站中的日志数据,获取该用户最感兴趣的特征词,并且在预设词向量库中存在该特征词的目标词向量时,确定词向量与该特征词相似度最大的特征词,根据两个特征词确定要推荐的商品推荐给用户。该方案能够提高设备处理能力,以及用户体验。
下面结合附图,详细说明本申请实施例中实现商品推荐过程。
参见图1,图1为本申请实施例中商品推荐流程示意图。具体步骤为:
步骤101,针对任一用户,设备获取该用户在购物网站的日志数据。
用户登录网站后,用户购物、浏览商品,搜索商品等行为,都会以日志的方式记录存储,直接在相关服务器上获取相关数据即可,该服务器与本申请中的设备可以为一个设备,也可以为不同设备。
步骤102,该设备从所述日志数据中提取该用户最感兴趣的特征词,所述特征词包括:品牌词,和/或品类词。
在获取的日志数据中提取用户最感兴趣的特征词。可以按照如下方式实现,但是不限于如下实现方式:
第一种:
统计特征词出现的频率,出现频率最高的特征词作为用户最感兴趣的特征词;
第二种:
通过神经网络学习确定,即将用户的每个日志数据中的特征词标出,并将日志数据作为样本数据,同时可以考虑时间递减因素,通过神经网络学习预测用户当前最感兴趣的特征词。
本申请实施例中的特征词可以为品牌词,如only,zara等;可以为品类词,如手机、零食等三级类目词,根据不同网站的级别类目定义确定;还可以为特殊属性、标签词等,如服饰风格词等。
步骤103,该设备在预设词向量库中匹配所述特征词的目标词向量。
预设词向量库为预先生成的向量库,具体生成过程如下:
第一步、爬取购物网站所有商品的描述信息;
第二步、对每个商品的描述信息进行分词,获得该商品的特征词,并形成一个词序列;
本步骤中对每个商品的描述信息进行分词,获得该商品的特征词的过程中需进行如下处理:
在分词时,采用中英文词典进行中英文替换;以确保中文切词;
过滤掉分词中的停用词;
过滤掉词频较低的特征词;
收集并保留品牌词和品类词。保证品牌词和品类词能够被存储在电商词典中,即保留下来,且商品的描述信息中的品牌词和品类词被完成切分。
在具体实现时,如果仅实现特征词为品牌词的技术方案,则在获得商品特征词时可以不收集品类词;如果仅实现特征词为品类词的技术方案,则在获得商品特征词时可以不收集品牌词。
第三步、将每个商品的词序列作为一个样本输入到神经网络语言模型中,训练获得每个特征词的词向量,生成预设词向量库。
神经网络语言模型可以使用word2vec模型。
word2vec的本质是一个神经网络语言模型,基于语言模型进行分布式词向量的训练。与传统神经概率语言模型不同的是,提出了新的方法进行训练:CBOW模型和Skip-gram模型。同时为了加快训练速度,使用Hierarchical Softmax和Negative Sampling这两种tricks。
从最原始的文本去学习词向量,Word2vec是一个特别有效的预测模型(Predictive models)。给定前面的词(previous words)的概率hh(for“history”)来预测下一个词的概率wtwt(for“target”),为了最大化预测概率传统的神经网络概率语言模型都是使用最大似然(maximum likelihood ML)来进行训练。
步骤104,该设备当匹配到目标词向量时,分别计算该目标词向量与预设词向量库中其它特征词的词向量的相似度。
本申请实施例中计算两个词向量的相识度的算法可以为余弦距离、欧氏距离,但是并不限于以上算法计算词向量的相似度。
当未匹配到目标词向量时,根据所述特征词确定要推荐的商品,并输出给所述用户。
步骤105,该设备确定相似度最高的词向量对应的特征词作为扩展词。
步骤106,该设备根据该用户最感兴趣的特征词,以及获取的扩展词确定要推荐的商品,并输出给所述用户。
当所述特征词A为品牌词或品类词时,若预设词向量库中有10个特征词向量,且存在特征词A的目标词向量,则需要计算特征词A的目标词向量与其他9个特征词向量进行相似度计算,取相似度最高的词向量对应的特征值作为扩展词进行商品推荐;
如果相似度最高的词向量为多个,则对应的特征词均作为扩展词进行商品推荐。
当所述特征词包括品牌词和品类词,在预设词向量库中匹配所述特征词的目标词向量时,分别进行匹配,并分别确定相似度最高的词向量对应的特征词,具体实现如下:
如特征词包括:最感兴趣的品牌词B和最感兴趣的品类词C,且预设词向量库中有10个特征词向量,且存在品牌词B和品类词C的目标词向量,(如果在预设词向量库中只匹配到品牌词B或品类词C,则实现方式同上特征词只包括其一的实现过程);则需要计算品牌词B的目标词向量与其他9个特征词向量进行相似度计算,品类词C的目标词向量与其他9个特征词向量进行相似度计算;分别取相似度最高的词向量对应的特征值作为扩展词进行商品推荐;
如果相似度最高的词向量为多个,则对应的特征词均作为扩展词进行商品推荐。
通过上述方式能够准确、高效地为用户推荐用户最感兴趣的标签对应的商品,以及最感兴趣的标签的扩展标签对应的商品,能够提高用户体验,丰富用户的推荐范围,进而提高用户的转化率。
基于同样的发明构思,本申请实施例中提供一种商品推荐装置。参见图2,图2为本申请实施例中应用于上述技术的装置结构示意图。该装置包括:获取单元201、提取单元202、匹配单元203、处理单元204、确定单元205和输出单元206;
获取单元201,用于针对任一用户,获取该用户在购物网站的日志数据;
提取单元202,用于提取获取单元201获取的日志数据中该用户最感兴趣的特征词,所述特征词包括:品牌词,和/或品类词;
匹配单元203,用于在预设词向量库中匹配提取单元202提取的特征词的目标词向量;
处理单元204,用于当匹配单元203匹配到目标词向量时,分别计算该目标词向量与预设词向量库中其它特征词的词向量的相似度;
确定单元205,用于确定处理单元204中相似度最高的词向量对应的特征词作为扩展词;根据该用户最感兴趣的特征词,以及获取的扩展词确定要推荐的商品;
输出单元206,用于将确定单元205确定的商品输出给所述用户。
较佳地,
所述预设词向量库的生成,包括:爬取购物网站所有商品的描述信息;对每个商品的描述信息进行分词,获得该商品的特征词,并形成一个词序列;将每个商品的词序列作为一个样本输入到神经网络语言模型中,训练获得每个特征词的词向量,生成预设词向量库。
较佳地,
所述对每个商品的描述信息进行分词,获得该商品的特征词,包括:
在分词时,采用中英文词典进行中英文替换;
过滤掉分词中的停用词;
过滤掉词频较低的特征词;
收集并保留品牌词和品类词。
较佳地,
当所述特征词包括品牌词和品类词,在预设词向量库中匹配所述特征词的目标词向量时,分别进行匹配,并分别确定相似度最高的词向量对应的特征词。
较佳地,
确定单元205,进一步用于当未匹配到目标词向量时,根据所述特征词确定要推荐的商品,并触发输出单元206输出给所述用户。
上述实施例的单元可以集成于一体,也可以分离部署;可以合并为一个单元,也可以进一步拆分成多个子单元。
此外,本申请实施例中还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述商品推荐方法所执行的步骤。
另外,本申请实施例中还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述商品推荐方法所执行的步骤。
综上所述,本申请通过用户在购物网站中的日志数据,获取该用户最感兴趣的特征词,并且在预设词向量库中存在该特征词的目标词向量时,确定词向量与该特征词相似度最大的特征词,根据两个特征词确定要推荐的商品推荐给用户。该方案能够提高设备处理能力,以及用户体验。
上述方案能够准确、高效地为用户推荐用户最感兴趣的标签对应的商品,以及最感兴趣的标签的扩展标签对应的商品,能够提高用户体验,丰富用户的推荐范围,进而提高用户的转化率。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (12)

1.一种商品推荐方法,其特征在于,该方法包括:
针对任一用户,获取该用户在购物网站的日志数据;并提取该用户最感兴趣的特征词,所述特征词包括:品牌词,和/或品类词;
在预设词向量库中匹配所述特征词的目标词向量;
当匹配到目标词向量时,分别计算该目标词向量与预设词向量库中其它特征词的词向量的相似度;
确定相似度最高的词向量对应的特征词作为扩展词;
根据该用户最感兴趣的特征词,以及获取的扩展词确定要推荐的商品,并输出给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述预设词向量库的生成,包括:
爬取购物网站所有商品的描述信息;
对每个商品的描述信息进行分词,获得该商品的特征词,并形成一个词序列;
将每个商品的词序列作为一个样本输入到神经网络语言模型中,训练获得每个特征词的词向量,生成预设词向量库。
3.根据权利要求2所述的方法,其特征在于,所述对每个商品的描述信息进行分词,获得该商品的特征词,包括:
在分词时,采用中英文词典进行中英文替换;
过滤掉分词中的停用词;
过滤掉词频较低的特征词;
收集并保留品牌词和品类词。
4.根据权利要求1所述的方法,其特征在于,
当所述特征词包括品牌词和品类词,在预设词向量库中匹配所述特征词的目标词向量时,分别进行匹配,并分别确定相似度最高的词向量对应的特征词。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法进一步包括:
当未匹配到目标词向量时,根据所述特征词确定要推荐的商品,并输出给所述用户。
6.一种商品推荐装置,其特征在于,该装置包括:获取单元、提取单元、匹配单元、处理单元、确定单元和输出单元;
所述获取单元,用于针对任一用户,获取该用户在购物网站的日志数据;
所述提取单元,用于提取所述获取单元获取的日志数据中该用户最感兴趣的特征词,所述特征词包括:品牌词,和/或品类词;
所述匹配单元,用于在预设词向量库中匹配所述提取单元提取的特征词的目标词向量;
所述处理单元,用于当所述匹配单元匹配到目标词向量时,分别计算该目标词向量与预设词向量库中其它特征词的词向量的相似度;
所述确定单元,用于确定所述处理单元中相似度最高的词向量对应的特征词作为扩展词;根据该用户最感兴趣的特征词,以及获取的扩展词确定要推荐的商品;
所述输出单元,用于将所述确定单元确定的商品输出给所述用户。
7.根据权利要求6所述的装置,其特征在于,所述预设词向量库的生成,包括:爬取购物网站所有商品的描述信息;对每个商品的描述信息进行分词,获得该商品的特征词,并形成一个词序列;将每个商品的词序列作为一个样本输入到神经网络语言模型中,训练获得每个特征词的词向量,生成预设词向量库。
8.根据权利要求7所述的装置,其特征在于,
所述对每个商品的描述信息进行分词,获得该商品的特征词,包括:
在分词时,采用中英文词典进行中英文替换;
过滤掉分词中的停用词;
过滤掉词频较低的特征词;
收集并保留品牌词和品类词。
9.根据权利要求7所述的装置,其特征在于,
当所述特征词包括品牌词和品类词,在预设词向量库中匹配所述特征词的目标词向量时,分别进行匹配,并分别确定相似度最高的词向量对应的特征词。
10.根据权利要求6-9任一项所述的装置,其特征在于,
所述确定单元,进一步用于当未匹配到目标词向量时,根据所述特征词确定要推荐的商品,并触发所述输出单元输出给所述用户。
11.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-5任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述的方法。
CN201811465546.9A 2018-12-03 2018-12-03 一种商品推荐方法和装置 Pending CN111260428A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811465546.9A CN111260428A (zh) 2018-12-03 2018-12-03 一种商品推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811465546.9A CN111260428A (zh) 2018-12-03 2018-12-03 一种商品推荐方法和装置

Publications (1)

Publication Number Publication Date
CN111260428A true CN111260428A (zh) 2020-06-09

Family

ID=70951968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811465546.9A Pending CN111260428A (zh) 2018-12-03 2018-12-03 一种商品推荐方法和装置

Country Status (1)

Country Link
CN (1) CN111260428A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737418A (zh) * 2020-07-20 2020-10-02 北京每日优鲜电子商务有限公司 搜索词和商品的相关性预测方法、设备和存储介质
CN112330408A (zh) * 2020-11-13 2021-02-05 上海络昕信息科技有限公司 一种产品推荐方法、装置及电子设备
CN112380347A (zh) * 2020-11-24 2021-02-19 苏宁云计算有限公司 一种关联品类词的确定方法、装置及系统
CN113763082A (zh) * 2020-09-04 2021-12-07 北京沃东天骏信息技术有限公司 一种信息推送方法和装置
CN116308683A (zh) * 2023-05-17 2023-06-23 武汉纺织大学 基于知识图谱的服装品牌定位推荐方法、设备及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737418A (zh) * 2020-07-20 2020-10-02 北京每日优鲜电子商务有限公司 搜索词和商品的相关性预测方法、设备和存储介质
CN111737418B (zh) * 2020-07-20 2021-05-14 北京每日优鲜电子商务有限公司 搜索词和商品的相关性预测方法、设备和存储介质
CN113763082A (zh) * 2020-09-04 2021-12-07 北京沃东天骏信息技术有限公司 一种信息推送方法和装置
CN112330408A (zh) * 2020-11-13 2021-02-05 上海络昕信息科技有限公司 一种产品推荐方法、装置及电子设备
CN112380347A (zh) * 2020-11-24 2021-02-19 苏宁云计算有限公司 一种关联品类词的确定方法、装置及系统
CN112380347B (zh) * 2020-11-24 2022-11-18 苏宁云计算有限公司 一种关联品类词的确定方法、装置及系统
CN116308683A (zh) * 2023-05-17 2023-06-23 武汉纺织大学 基于知识图谱的服装品牌定位推荐方法、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109815308B (zh) 意图识别模型的确定及检索意图识别方法、装置
CN109376309B (zh) 基于语义标签的文档推荐方法和装置
US11055557B2 (en) Automated extraction of product attributes from images
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN106951422B (zh) 网页训练的方法和装置、搜索意图识别的方法和装置
CN107085581B (zh) 短文本分类方法和装置
CN106599226B (zh) 一种内容推荐方法及内容推荐系统
CN111260428A (zh) 一种商品推荐方法和装置
CN107608956A (zh) 一种基于cnn‑grnn的读者情绪分布预测算法
CN107357793B (zh) 信息推荐方法和装置
CN111159485B (zh) 尾实体链接方法、装置、服务器及存储介质
CN111563384B (zh) 面向电商产品的评价对象识别方法、装置及存储介质
CN111783518A (zh) 训练样本生成方法、装置、电子设备及可读存储介质
CN107729453B (zh) 一种提取中心产品词的方法和装置
CN112069312B (zh) 一种基于实体识别的文本分类方法及电子装置
CN109086265B (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN112380349A (zh) 商品性别分类方法、装置及电子设备
CN111832290A (zh) 用于确定文本相关度的模型训练方法、装置、电子设备及可读存储介质
CN111666766A (zh) 数据处理方法、装置和设备
CN110955750A (zh) 评论区域和情感极性的联合识别方法、装置、电子设备
CN112084307A (zh) 一种数据处理方法、装置、服务器及计算机可读存储介质
CN114881742A (zh) 基于商品知识图谱的图神经网络推荐方法和系统
CN114328798B (zh) 搜索文本的处理方法、装置、设备、存储介质和程序产品
CN108717436B (zh) 一种基于显著性检测的商品目标快速检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination