CN107038609A - 一种基于深度学习的商品推荐方法及系统 - Google Patents
一种基于深度学习的商品推荐方法及系统 Download PDFInfo
- Publication number
- CN107038609A CN107038609A CN201710271969.6A CN201710271969A CN107038609A CN 107038609 A CN107038609 A CN 107038609A CN 201710271969 A CN201710271969 A CN 201710271969A CN 107038609 A CN107038609 A CN 107038609A
- Authority
- CN
- China
- Prior art keywords
- comment
- commodity
- deep learning
- carried out
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0282—Rating or review of business operators or products
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0269—Targeted advertisements based on user profile or attribute
- G06Q30/0271—Personalized advertisement
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于深度学习的商品推荐方法,包括以下步骤:S1:通过爬虫抓取商品的评论数据;S2:对评论数据进行数据预处理;S3:对数据进行特征提取;S4:对商品评论进行细粒度分析;S5:对商品评论进行量化打分;S6:结合协同过滤进行商品推荐。同时,本发明还提供了一种基于深度学习的商品推荐系统。相比于现有技术,本发明结合深度学习的方法对文本进行细化处理,并将其通过模糊隶属函数进行量化,可将用户的评论转化为对商品各项属性的打分情况,再结合协同过滤方法进行推荐,可达到较好的推荐效果。
Description
技术领域
本发明涉及一种推荐方法,特别是一种基于深度学习的商品推荐方法及系统。
背景技术
伴随着互联网的发展,电子商务作为新兴产业应运而生,电子商务把商品从实体店搬运到网络的虚拟环境中,使得用户足不出户就可以购物。虚拟购物的优势在于降低了卖家的成本,提高了买家的购物体验。但对于网络购物的用户来说,网络上纷繁多样的商品给挑选带来了麻烦。解决这一问题的方法就是使用推荐系统为用户做出个性化的物品推荐,也就是说可以通过分析用户以往购物的浏览、点击、购买,评论等行为以及用户自身的属性得出用户的潜在兴趣,从而将用户感兴趣的商品推荐给用户。个性化推荐的意义在于可以提高用户挑选商品的效率,对于电子商务网站而言,精准的个性化推荐可以提高用户行为的转化率,从而提高网站的收益。Amazon是电子商务领域运用推荐系统的代表,Amazon的前科学家Greg Linden在他的博客中提到,2006年,推荐系统对Amazon的贡献额在35%左右。目前推荐系统在互联网上已经得到了广泛的应用,Netflix曾开出100万美元的奖金,奖励给能将其电影推荐精度提高10%的个人或者团队,除此以外,推荐系统应用的例子还有Google的新闻推荐、Delicious的网页推荐、Facebook的朋友推荐等。
推荐系统可以分成三类:基于内容推荐、协同过滤推荐和基于内容和协同过滤的混合推荐。基于内容推荐是基于用户和物品的内容信息做出推荐,不需要用户对物品的评价,即用户行为,因此该方法没有冷启动和数据稀疏性问题。基于内容推荐的主要缺点是要求抽取的特征既要保证准确性又要有实际意义,通常情况下这是很难做到的。协同过滤推荐的基本原理是给目标用户推荐和其相似的用户喜好的物品或者给目标用户推荐和其以往有过行为的物品相似的物品。协同过滤的优点是能够共享他人的经验,从而能够避免基于内容推荐存在的内容分析不完全和不精确的问题,并且能够基于一些复杂的、难以表述的概念(如个人品味)进行过滤。但由于协同过滤方法依赖用户行为数据,因此存在冷启动和数据稀疏性问题。基于内容和协同过滤的混合推荐结合了上述两类推荐方法的优点,将内容和用户行为互相作为信息补充,从而降低了抽取所得特征的准确性对基于内容推荐的影响以及用户行为数据稀疏性对协同过滤推荐的影响。
然而,大部分的推荐系统依赖于用户对项目的历史评分记录来预测新的商品的打分,但是针对一些商品,如酒店餐馆等的情况,用户只有对商品的点评记录,没有打分的情况则没有好的办法进行处理。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供了一种基于深度学习的商品推荐方法及系统。
本发明通过以下的方案实现:一种基于深度学习的商品推荐方法,包括以下步骤:
S1:通过爬虫抓取商品的评论数据;
S2:对评论数据进行数据预处理;
S3:对数据进行特征提取;
S4:对商品评论进行细粒度分析;
S5:对商品评论进行量化打分;
S6:结合协同过滤进行商品推荐。
作为本发明的进一步改进,所述步骤S2中,具体包括以下步骤:
S21:对评论数据进行分词;
S22:进行停用词过滤;
S23:对词性进行标注。
作为本发明的进一步改进,所述步骤S3具体为:通过词频分析工具统计商品评论语料中所有名词出现的频率。
作为本发明的进一步改进,所述步骤S4中具体包括以下步骤:
S41:对商品评论文本单词进行向量化;
S42:通过深度递归网络的细粒度情感分析模型进行情感分析。
作为本发明的进一步改进,所述步骤S5中具体为:构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。
本发明还提供了一种基于深度学习的商品推荐系统,其包括:
数据抓取模块,用于通过爬虫抓取商品的评论数据;
预处理模块,用于对评论数据进行数据预处理;
特征提取模块,用于对数据进行特征提取;
细粒度分析模块,用于对商品评论进行细粒度分析;
量化打分模块,用于对商品评论进行量化打分;
推荐模块,用于结合协同过滤进行商品推荐。
作为本发明的进一步改进,所述预处理模块包括:
分词子模块,用于对评论数据进行分词。
停用词过滤子模块,用于进行停用词过滤。
词性标注子模块,用于对词性进行标注。
作为本发明的进一步改进,所述特征提取模块通过词频分析工具统计商品评论语料中所有名词出现的频率。
作为本发明的进一步改进,所述细粒度分析模块包括:
向量化子模块,用于对商品评论文本单词进行向量化;
情感分析模块,用于通过深度递归网络的细粒度情感分析模型进行情感分析。
作为本发明的进一步改进,所述量化打分模块通过构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。
相比于现有技术,本发明结合深度学习的方法对文本进行细化处理,并将其通过模糊隶属函数进行量化,可将用户的评论转化为对商品各项属性的打分情况,再结合协同过滤方法进行推荐,可达到较好的推荐效果。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1是本发明的基于深度学习的商品推荐方法的步骤流程图。
图2是本发明的商品评论文本的细粒度分析过程示意图。
图3是递归自编码的神经网络结构图。
图4是两类不同的样本数据示意图。
图5是发明的基于深度学习的商品推荐系统的模块框图。
图6是分词后的示意图。
图7是宾馆餐饮特征和指示词的示意图。
具体实施方式
以下结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
为了解决现有技术的缺陷,本发明提供了一种基于深度学习的商品推荐方法和系统。以下具体介绍本发明的技术方案:
请参阅图1,其为本发明的基于深度学习的商品推荐方法的步骤流程图。
本发明提供了一种基于深度学习的商品推荐方法,包括以下步骤:
S1:通过爬虫抓取商品的评论数据。
S2:对评论数据进行数据预处理。具体的,所述步骤S2中具体包括以下步骤:
S21:对评论数据进行分词。
S22:进行停用词过滤。
S23:对词性进行标注。
例如:针对宾馆,酒店,饭馆等的评论及打分通过爬虫抓取后进行预处理。具体可以采用中科院ICTCLAS开源项目软件对评论语料进行分词、停用词过滤词性标注。通过词性标注,可以判断评论语料的词性,帮助我们提取出产品特征和识别用户观点。
S3:对数据进行特征提取,具体为:通过词频分析工具统计商品评论语料中所有名词出现的频率。
例如,可以使用词频分析工具软件统计评论语料中所有名词出现的频率,抽取排名在100位之前的名词,人工判别其是否与商品如宾馆餐饮等有关。保留诸如“菜系”“地域”这些与宾馆餐饮有关的特征。在此基础上将这些特征分类,由此得到宾馆餐饮特征和指示词。
S4:对商品评论进行细粒度分析。其中,在所述步骤S4中具体包括以下两个步骤:
S41:对商品评论文本单词进行向量化;
S42:通过深度递归网络的细粒度情感分析模型进行情感分析。
请参阅图2,其为本发明的商品评论文本的细粒度分析过程示意图。在进行细粒度分析过程中,包括评论文本单词向量化和情感分析,具体的分析过程如下:
(a)评论文本单词向量化
面对非结构性评论文本,先将词汇进行向量化。建立词向量空间通过无监督语义Word2Vec模型进行训练。word2vec是以神经概率语言模型为基础。
(b)基于深度递归网络的细粒度情感分析模型
由上下文语义训练得到的词向量空间对单词语义关联具有很大价值,语义向量空间常常被作为文本特征进行探究。然而当需要一个规则的方法来表达一个词组或语句的意义,词向量去表现乏力,因此需要建立一个能够融合单词语义的模型。2011年RichardSocher等人提出了使用递归自编码(RAE)模型对词的组合性进行特征提取,从而进一步完成对句子的情感分类。
递归自编码模型构造的第一层神经网络为无监督递归自编码模型,因此首先建立无监督的段向量递归自编码模型。例如,子节点x1“白云”的向量表示为[0.1,0.5,0.7…],子节点x2“宾馆”的向量表示为[0.3,0.5,0.1…],通过自编码的递归网络就可以得到它们父节点y“白云宾馆”的向量表示,即x1,x2可以通过非线性函数映射到
y=f(W(1)[x1;x2]+b(1));(1-1)
其中[x1;x2]∈R2n,W(1)∈Rn×2n为网络中的参数矩阵;b(1)∈Rn为偏置项。
为了验证父节点y对子节点x1,x2的信息保留程度,我们将通过建立一层重构层,通过y重构出x1,x2:
其中是重构子节点;是参数矩阵;b(2)∈Rn是偏置项。所以递归自编码的神经网络结构如图3所示。
使用欧式距离衡量重构节点与原节点相似程度:
为了解决叶子节点与非叶子节点重要性问题,避免单个词语对整个句子意思的控制,达到平衡误差的效果,我们重新给出对重构误差Eres的定义:
其中n1为x1的叶子节点个数;n2为x2的叶子节点个数;θ为网络所有的未知参数统一表示。
当我们对整条评论进行递归地使用模型,结合梯度下降优化算法,便可以得到整条评论的n维段向量,此时目标函数为:
其中C为整个评论语料库,y表示一条评论,s为每一层递归网络。
在无监督的递归自编码模型基础上,引入情感极性实现对父节点向量的分类,采用Softmax单层神经网络进行情感学习。用情感向量Ps来描述一个词组的情感极性:
其中为Softmax的参数矩阵(K为情感极性的维度,如果只有积极、消极两类,则K=2,分类越细化,K值越大)。
S5:对商品评论进行量化打分。
具体的,经过语料分析和情感分析之后可得到商品的特征和属性集,如针对酒店可选取特征词“服务,位置,餐饮,房间设施,卫生,卫浴,网络”等,如网络上对于苏州南园宾馆的评论有367条,经过分析可得到以下结果:
“服务周到(165)位置优越(90)餐饮不错(75)房间设施好(59)卫生干净(32)卫浴好(15)网络好(5)安静(1)房间设施差(26)”。后面的数字表示人数统计,为了便于构造矩阵将对应词语模糊量化,构造情感词语所对应的模糊集合,如“很好”表示9.5分,“好”则是8分,“一般”6.5分,“差”4分,“极差”2分,以此类推。用户对宾馆的总体打分采取对各个分项(如服务,位置,房间设施等)加权求和的结果。用户的评分行为可以表示成一个评分矩阵R,R[u][i]表示用户u对物品i的评分。
S6:结合协同过滤进行商品推荐。
在本步骤中具体的采用基于项目的协同过滤方法进行推荐,它使用用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史打分信息,将类似的物品推荐给用户。具体的过程和原理如下:
根据对评论文本的分析,得出的结果经模糊集量化后,再进行加权平均。
1、针对积极的情感,如服务周到(165),有165人点评服务周到,点评总人数190,则对服务最终打分为9.5*165/190。
2、针对消极的情感,如房间设施差(26),即190人有26人点评房间设施差,则针对房间设施的打分=4*(190-26)/190。
经过处理后可得到以下矩阵:
宾馆名称 | 服务 | 位置 | 餐饮 | 房间设施 | 卫生 | 卫浴 | 网络 | ... |
宾馆1 | 9 | 6 | 6 | 5 | 6 | 5 | 8 | ... |
宾馆2 | 5 | 9 | 4 | 7 | 8 | 7 | 5 | ... |
宾馆3 | 4 | 8 | 4 | 6.5 | 8 | 7 | 5 | ... |
宾馆4 | 8 | 7 | 5 | 5 | 6 | 6 | 8 | ... |
... | ... | ... | ... | ... | ... | ... | .. | ... |
采用最近邻查询计算项目与项目之间的相似性,搜索目标项目的最近邻居;产生推荐阶段是根据用户对目标项目的最近邻居的评分信息预测目标项目的评分,最后产生前N个推荐信息。
最近邻算法(KNN)原理:
如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。
例如:根据下图4所示,有两类不同的样本数据,分别用的小正方形和小三角形表示,而图正中间的那个圆点所标示的数据则是待分类的数据。也就是说,现在,我们不知道中间那个绿色的数据是从属于哪一类(小正方形or小三角形)
1)如果K=3,圆点的最近的3个邻居是2个小三角形和1个小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于的三角形一类。
2)如果K=5,圆点的最近的5个邻居是2个三角形和3个的正方形,还是少数从属于多数,基于统计的方法,判定这个待分类点属于的正方形一类。
K近邻模型的特征空间一般是n维实数向量空间,使用的距离是欧式距离(如空间x,y两点的距离如下):
另外,为了实现上述的推荐方法,本发明还提供了一种基于深度学习的商品推荐系统。请同时参阅图5,其为本发明的基于深度学习的商品推荐系统的模块框图。本发明还提供了一种基于深度学习的商品推荐系统,其包括:数据抓取模块1、预处理模块2、特征提取模块3、细粒度分析模块4、量化打分模块5和推荐模块6。
所述数据抓取模块1,用于通过爬虫抓取商品的评论数据;
所述预处理模块2,用于对评论数据进行数据预处理。具体的,所述预处理模块包括:分词子模块21、停用词过滤子模块22和词性标注子模块23。
所述分词子模块21,用于对评论数据进行分词。
所述停用词过滤子模块22,用于进行停用词过滤。
所述词性标注子模23块,用于对词性进行标注。
所述特征提取模块3,用于对数据进行特征提取。具体的,所述特征提取模块通过词频分析工具统计商品评论语料中所有名词出现的频率。
所述细粒度分析模块4,用于对商品评论进行细粒度分析。具体的,所述细粒度分析模块包括:向量化子模块41和情感分析模块42。
所述向量化子模块41,用于对商品评论文本单词进行向量化;
所述情感分析模块42,用于通过深度递归网络的细粒度情感分析模型进行情感分析。
所述量化打分模块5,用于对商品评论进行量化打分。具体的,所述量化打分模块通过构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。
所述推荐模块6,用于结合协同过滤进行商品推荐。
本发明的基于深度学习的商品推荐系统的实现过程和原理,可以参阅上述基于深度学习的商品推荐方法,故不赘述。
以下通过一个具体的实例,介绍本发明的基于深度学习的商品推荐方法是如何应用的:
步骤1、爬取携程艺龙网的酒店评论文本。
例如针对九寨沟郦湾度假酒店的评论:
“离九寨沟客运汽车站步行5分钟,慢走最多7分钟就到了,就在汽车客运站门前的隔壁的隔壁的隔壁就是,门脸还算很大气,比九寨一般酒店装修新不少,一看就是这一两年新建的,三四层楼吧,房间内部装修也算用心,发图片给我之前去过酒店的朋友看,他们都很惊讶九寨那么偏远的山沟沟景区都有这么华丽的酒店了他们都很惊讶和羡慕,屋内地热取暖,没有电热毯,但地热升温超级快,踩在地上很舒服,洗澡电视被褥都满意,价格是一晚197元,淡季全是最高档的酒店吧,就这种住宿条件,旺季应该七八百吧”。
步骤2、数据预处理
采用中科院ICTCLAS开源项目软件对评论语料进行分词、停用词过滤,词性标注。通过词性标注,可以判断评论语料的词性。
如图6所示,其为分词后的示意图。具体的,在附图中采用不同深度的颜色代表不同的词性,词后所加的字母也代表该词的词性。
步骤3、使用词频分析工具软件统计评论语料中所有名词出现的频率,抽取排名在100位之前的名词,人工判别其是否与商品如宾馆餐饮等有关。保留诸如“菜系”“地域”这些与宾馆餐饮有关的特征。在此基础上将这些特征分类,由此得到宾馆餐饮特征和指示词,具体参见图7,其为宾馆餐饮特征和指示词的示意图。
步骤4、酒店评论文本细粒度分析
先用Word2vec工具将文本向量化,向量化之后输入深度递归网络进行分析。
步骤5、对输出结果统计并量化
经过语料分析和情感分析之后可得到商品的特征和属性集,如针对酒店可选取特征词“服务,位置,餐饮,房间设施,卫生,卫浴,网络”等,如网络上对于九寨沟郦湾度假酒店的评论有367条,经过分析可得到以下结果:
“服务周到(165)位置优越(90)餐饮不错(75)房间设施好(59)卫生干净(32)卫浴好(15)网络好(5)安静(1)房间设施差(26)”。后面的数字表示人数统计,为了便于构造矩阵将对应词语模糊量化,构造情感词语所对应的模糊集合,如“很好”表示9.5分,“好”则是8分,“一般”6.5分,“差”4分,“极差”2分,以此类推。用户对宾馆的总体打分采取对各个分项(如服务,位置,房间设施等)加权求和的结果。用户的评分行为可以表示成一个评分矩阵R,R[u][i]表示用户u对物品i的评分。
步骤6、采用基于项目的协同过滤方法进行推荐,它使用用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史打分信息,将类似的物品推荐给用户。
根据对评论文本的分析,得出的结果经模糊集量化后,再进行加权平均。
1、针对积极的情感,如服务周到(165),有165人点评服务周到,点评总人数190,则对服务最终打分为9.5*165/190。
2、针对消极的情感,如房间设施差(26),即190人有26人点评房间设施差,则针对房间设施的打分=4*(190-26)/190.
经过处理后可得到以下矩阵:
采用最近邻查询计算项目与项目之间的相似性,搜索目标项目的最近邻居;产生推荐阶段是根据用户对目标项目的最近邻居的评分信息预测目标项目的评分,最后产生前N个推荐信息。
相比于现有技术,本发明结合深度学习的方法对文本进行细化处理,并将其通过模糊隶属函数进行量化,可将用户的评论转化为对商品各项属性的打分情况,再结合协同过滤方法进行推荐,可达到较好的推荐效果。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (10)
1.一种基于深度学习的商品推荐方法,其特征在于:包括以下步骤:
S1:通过爬虫抓取商品的评论数据;
S2:对评论数据进行数据预处理;
S3:对数据进行特征提取;
S4:对商品评论进行细粒度分析;
S5:对商品评论进行量化打分;
S6:结合协同过滤进行商品推荐。
2.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S2中,具体包括以下步骤:
S21:对评论数据进行分词;
S22:进行停用词过滤;
S23:对词性进行标注。
3.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S3具体为:通过词频分析工具统计商品评论语料中所有名词出现的频率。
4.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S4中具体包括以下步骤:
S41:对商品评论文本单词进行向量化;
S42:通过深度递归网络的细粒度情感分析模型进行情感分析。
5.根据权利要求1所述基于深度学习的商品推荐方法,其特征在于:所述步骤S5中具体为:构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。
6.一种基于深度学习的商品推荐系统,其特征在于:包括:
数据抓取模块,用于通过爬虫抓取商品的评论数据;
预处理模块,用于对评论数据进行数据预处理;
特征提取模块,用于对数据进行特征提取;
细粒度分析模块,用于对商品评论进行细粒度分析;
量化打分模块,用于对商品评论进行量化打分;
推荐模块,用于结合协同过滤进行商品推荐。
7.根据权利要求6所述基于深度学习的商品推荐系统,其特征在于:所述预处理模块包括:
分词子模块,用于对评论数据进行分词。
停用词过滤子模块,用于进行停用词过滤。
词性标注子模块,用于对词性进行标注。
8.根据权利要求6所述基于深度学习的商品推荐系统,其特征在于:所述特征提取模块通过词频分析工具统计商品评论语料中所有名词出现的频率。
9.根据权利要求6所述基于深度学习的商品推荐系统,其特征在于:所述细粒度分析模块包括:
向量化子模块,用于对商品评论文本单词进行向量化;
情感分析模块,用于通过深度递归网络的细粒度情感分析模型进行情感分析。
10.根据权利要求6所述基于深度学习的商品推荐系统,其特征在于:所述量化打分模块通过构造矩阵将对应词语模糊量化和构造情感词语所对应的模糊集合,将商品评论转化为评分矩阵R[u][i],标志用户u对物品i的评分。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710271969.6A CN107038609A (zh) | 2017-04-24 | 2017-04-24 | 一种基于深度学习的商品推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710271969.6A CN107038609A (zh) | 2017-04-24 | 2017-04-24 | 一种基于深度学习的商品推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107038609A true CN107038609A (zh) | 2017-08-11 |
Family
ID=59536115
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710271969.6A Pending CN107038609A (zh) | 2017-04-24 | 2017-04-24 | 一种基于深度学习的商品推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107038609A (zh) |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107609960A (zh) * | 2017-10-18 | 2018-01-19 | 口碑(上海)信息技术有限公司 | 推荐理由生成方法及装置 |
CN108197106A (zh) * | 2017-12-29 | 2018-06-22 | 深圳市中易科技有限责任公司 | 一种基于深度学习的产品竞争分析方法、装置及系统 |
CN108416607A (zh) * | 2017-12-29 | 2018-08-17 | 南京邮电大学 | 一种基于旅客信任度的智能旅馆推荐方法 |
CN108549641A (zh) * | 2018-04-26 | 2018-09-18 | 中国联合网络通信集团有限公司 | 歌曲评定方法、装置、设备及存储介质 |
CN108710680A (zh) * | 2018-05-18 | 2018-10-26 | 哈尔滨理工大学 | 一种利用深度学习进行基于情感分析的电影推荐方法 |
CN109063034A (zh) * | 2018-07-16 | 2018-12-21 | 浙江大学 | 基于空间和社交多媒体数据的室内空间语义价值计算方法 |
CN109410011A (zh) * | 2018-11-05 | 2019-03-01 | 深圳市鹏朗贸易有限责任公司 | 认养产品的推荐方法、终端及计算机可读存储介质 |
CN109598586A (zh) * | 2018-11-30 | 2019-04-09 | 哈尔滨工程大学 | 一种基于注意力模型的推荐方法 |
CN109785062A (zh) * | 2019-01-10 | 2019-05-21 | 电子科技大学 | 一种基于协同过滤模型的混合神经网络推荐系统 |
WO2019109724A1 (zh) * | 2017-12-07 | 2019-06-13 | 华为技术有限公司 | 一种推荐物品的方法和装置 |
CN109919721A (zh) * | 2019-02-27 | 2019-06-21 | 上海宝尊电子商务有限公司 | 一种实时自动生成商品描述文本的方法 |
CN110060132A (zh) * | 2019-04-24 | 2019-07-26 | 吉林大学 | 基于细粒度数据的可解释商品推荐方法 |
CN110119443A (zh) * | 2018-01-18 | 2019-08-13 | 中国科学院声学研究所 | 一种面向推荐服务的情感分析方法 |
CN110134868A (zh) * | 2019-05-14 | 2019-08-16 | 辽宁工程技术大学 | 一种基于用户偏好异构性分析的推荐方法 |
CN111368210A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置以及电子设备 |
CN111401936A (zh) * | 2020-02-26 | 2020-07-10 | 中国人民解放军战略支援部队信息工程大学 | 一种基于评论空间和用户偏好的推荐方法 |
CN113127604A (zh) * | 2021-05-10 | 2021-07-16 | 齐鲁工业大学 | 基于评论文本的细粒度物品推荐方法及系统 |
CN113297391A (zh) * | 2021-05-28 | 2021-08-24 | 湖南大学 | 个性化推荐解释文本的生成方法、装置、系统及电子设备 |
US11100556B2 (en) | 2018-11-30 | 2021-08-24 | International Business Machines Corporation | Scenario enhanced search with product features |
CN113947455A (zh) * | 2021-10-14 | 2022-01-18 | 中国平安财产保险股份有限公司 | 数据推荐方法、系统、设备及介质 |
CN114529340A (zh) * | 2022-02-18 | 2022-05-24 | 浪潮卓数大数据产业发展有限公司 | 一种店铺推荐方法、装置及计算机介质 |
CN116883014A (zh) * | 2023-07-12 | 2023-10-13 | 深圳科迪新汇信息科技有限公司 | 基于分布式ai模型的客户满意度测评系统 |
US11869015B1 (en) | 2022-12-09 | 2024-01-09 | Northern Trust Corporation | Computing technologies for benchmarking |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049435A (zh) * | 2013-01-04 | 2013-04-17 | 浙江工商大学 | 文本细粒度情感分析方法及装置 |
CN103207855A (zh) * | 2013-04-12 | 2013-07-17 | 广东工业大学 | 针对产品评论信息的细粒度情感分析系统及方法 |
CN103383685A (zh) * | 2012-05-02 | 2013-11-06 | 腾讯科技(深圳)有限公司 | 一种基于用户点击数据的关键词属性量化方法及装置 |
CN105117428A (zh) * | 2015-08-04 | 2015-12-02 | 电子科技大学 | 一种基于词语对齐模型的web评论情感分析方法 |
US20160259857A1 (en) * | 2015-03-06 | 2016-09-08 | Microsoft Technology Licensing, Llc | User recommendation using a multi-view deep learning framework |
CN106127507A (zh) * | 2016-06-13 | 2016-11-16 | 四川长虹电器股份有限公司 | 一种基于用户评价信息的商品舆情分析方法及系统 |
-
2017
- 2017-04-24 CN CN201710271969.6A patent/CN107038609A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103383685A (zh) * | 2012-05-02 | 2013-11-06 | 腾讯科技(深圳)有限公司 | 一种基于用户点击数据的关键词属性量化方法及装置 |
CN103049435A (zh) * | 2013-01-04 | 2013-04-17 | 浙江工商大学 | 文本细粒度情感分析方法及装置 |
CN103207855A (zh) * | 2013-04-12 | 2013-07-17 | 广东工业大学 | 针对产品评论信息的细粒度情感分析系统及方法 |
US20160259857A1 (en) * | 2015-03-06 | 2016-09-08 | Microsoft Technology Licensing, Llc | User recommendation using a multi-view deep learning framework |
CN105117428A (zh) * | 2015-08-04 | 2015-12-02 | 电子科技大学 | 一种基于词语对齐模型的web评论情感分析方法 |
CN106127507A (zh) * | 2016-06-13 | 2016-11-16 | 四川长虹电器股份有限公司 | 一种基于用户评价信息的商品舆情分析方法及系统 |
Non-Patent Citations (1)
Title |
---|
梁军: ""基于深度学习的文本特征表示及分类应用"", 《中国优秀硕士学位论文全文数据库信息科技辑》 * |
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107609960A (zh) * | 2017-10-18 | 2018-01-19 | 口碑(上海)信息技术有限公司 | 推荐理由生成方法及装置 |
WO2019109724A1 (zh) * | 2017-12-07 | 2019-06-13 | 华为技术有限公司 | 一种推荐物品的方法和装置 |
CN108197106A (zh) * | 2017-12-29 | 2018-06-22 | 深圳市中易科技有限责任公司 | 一种基于深度学习的产品竞争分析方法、装置及系统 |
CN108416607A (zh) * | 2017-12-29 | 2018-08-17 | 南京邮电大学 | 一种基于旅客信任度的智能旅馆推荐方法 |
CN108197106B (zh) * | 2017-12-29 | 2021-07-13 | 深圳市中易科技有限责任公司 | 一种基于深度学习的产品竞争分析方法、装置及系统 |
CN110119443B (zh) * | 2018-01-18 | 2021-06-08 | 中国科学院声学研究所 | 一种面向推荐服务的情感分析方法 |
CN110119443A (zh) * | 2018-01-18 | 2019-08-13 | 中国科学院声学研究所 | 一种面向推荐服务的情感分析方法 |
CN108549641A (zh) * | 2018-04-26 | 2018-09-18 | 中国联合网络通信集团有限公司 | 歌曲评定方法、装置、设备及存储介质 |
CN108710680A (zh) * | 2018-05-18 | 2018-10-26 | 哈尔滨理工大学 | 一种利用深度学习进行基于情感分析的电影推荐方法 |
CN109063034B (zh) * | 2018-07-16 | 2022-01-04 | 浙江大学 | 基于空间和社交多媒体数据的室内空间语义价值计算方法 |
CN109063034A (zh) * | 2018-07-16 | 2018-12-21 | 浙江大学 | 基于空间和社交多媒体数据的室内空间语义价值计算方法 |
CN109410011A (zh) * | 2018-11-05 | 2019-03-01 | 深圳市鹏朗贸易有限责任公司 | 认养产品的推荐方法、终端及计算机可读存储介质 |
CN109598586A (zh) * | 2018-11-30 | 2019-04-09 | 哈尔滨工程大学 | 一种基于注意力模型的推荐方法 |
CN109598586B (zh) * | 2018-11-30 | 2022-11-15 | 哈尔滨工程大学 | 一种基于注意力模型的推荐方法 |
US11100556B2 (en) | 2018-11-30 | 2021-08-24 | International Business Machines Corporation | Scenario enhanced search with product features |
CN109785062A (zh) * | 2019-01-10 | 2019-05-21 | 电子科技大学 | 一种基于协同过滤模型的混合神经网络推荐系统 |
CN109785062B (zh) * | 2019-01-10 | 2021-09-24 | 电子科技大学 | 一种基于协同过滤模型的混合神经网络推荐系统 |
CN109919721A (zh) * | 2019-02-27 | 2019-06-21 | 上海宝尊电子商务有限公司 | 一种实时自动生成商品描述文本的方法 |
CN110060132A (zh) * | 2019-04-24 | 2019-07-26 | 吉林大学 | 基于细粒度数据的可解释商品推荐方法 |
CN110060132B (zh) * | 2019-04-24 | 2021-09-24 | 吉林大学 | 基于细粒度数据的可解释商品推荐方法 |
CN110134868A (zh) * | 2019-05-14 | 2019-08-16 | 辽宁工程技术大学 | 一种基于用户偏好异构性分析的推荐方法 |
CN111401936B (zh) * | 2020-02-26 | 2023-05-26 | 中国人民解放军战略支援部队信息工程大学 | 一种基于评论空间和用户偏好的推荐方法 |
CN111401936A (zh) * | 2020-02-26 | 2020-07-10 | 中国人民解放军战略支援部队信息工程大学 | 一种基于评论空间和用户偏好的推荐方法 |
CN111368210A (zh) * | 2020-05-27 | 2020-07-03 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置以及电子设备 |
CN111368210B (zh) * | 2020-05-27 | 2020-11-27 | 腾讯科技(深圳)有限公司 | 基于人工智能的信息推荐方法、装置以及电子设备 |
CN113127604A (zh) * | 2021-05-10 | 2021-07-16 | 齐鲁工业大学 | 基于评论文本的细粒度物品推荐方法及系统 |
CN113297391A (zh) * | 2021-05-28 | 2021-08-24 | 湖南大学 | 个性化推荐解释文本的生成方法、装置、系统及电子设备 |
CN113947455A (zh) * | 2021-10-14 | 2022-01-18 | 中国平安财产保险股份有限公司 | 数据推荐方法、系统、设备及介质 |
CN113947455B (zh) * | 2021-10-14 | 2024-06-11 | 中国平安财产保险股份有限公司 | 数据推荐方法、系统、设备及介质 |
CN114529340A (zh) * | 2022-02-18 | 2022-05-24 | 浪潮卓数大数据产业发展有限公司 | 一种店铺推荐方法、装置及计算机介质 |
US11869015B1 (en) | 2022-12-09 | 2024-01-09 | Northern Trust Corporation | Computing technologies for benchmarking |
CN116883014A (zh) * | 2023-07-12 | 2023-10-13 | 深圳科迪新汇信息科技有限公司 | 基于分布式ai模型的客户满意度测评系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107038609A (zh) | 一种基于深度学习的商品推荐方法及系统 | |
Toral et al. | Identification of the unique attributes of tourist destinations from online reviews | |
Zellers et al. | From recognition to cognition: Visual commonsense reasoning | |
Nilashi et al. | A hybrid method with TOPSIS and machine learning techniques for sustainable development of green hotels considering online reviews | |
Költringer et al. | Analyzing destination branding and image from online sources: A web content mining approach | |
CN105589948B (zh) | 一种文献引用网络可视化及文献推荐方法及系统 | |
Egger et al. | Identifying hidden semantic structures in Instagram data: a topic modelling comparison | |
CN105955981B (zh) | 一种基于需求分类和主题分析的个性化旅行包推荐方法 | |
CN108920641A (zh) | 一种信息融合个性化推荐方法 | |
Park et al. | An opinion-driven decision-support framework for benchmarking hotel service | |
CN109902201A (zh) | 一种基于cnn和bp神经网络的推荐方法 | |
Seyyedamiri et al. | Understanding destination brand love using machine learning and content analysis method | |
Kiliç et al. | An evaluation of airport service experience: An identification of service improvement opportunities based on topic modeling and sentiment analysis | |
CN107402912A (zh) | 解析语义的方法和装置 | |
CN109584006A (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
Mishra et al. | How delightful is Indian wellness tourism? A netnographic study | |
Rong et al. | Structural information aware deep semi-supervised recurrent neural network for sentiment analysis | |
Fu et al. | Understanding the customer experience and satisfaction of casino hotels in busan through online user-generated content | |
Tayal et al. | Personalized ranking of products using aspect-based sentiment analysis and Plithogenic sets | |
Du et al. | An interactive network for end-to-end review helpfulness modeling | |
Wingfield et al. | Sensorimotor distance: A grounded measure of semantic similarity for 800 million concept pairs | |
Borrajo-Millán et al. | Sentiment analysis to measure quality and build sustainability in tourism destinations | |
Sahebi et al. | A new approach in marketing research: Identifying the customer expected value through machine learning and big data analysis in the tourism industry | |
Zhang et al. | SEMA: Deeply learning semantic meanings and temporal dynamics for recommendations | |
CN113220985B (zh) | 基于健康养老环境下嵌入式用户画像模型的服务推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170811 |
|
RJ01 | Rejection of invention patent application after publication |