CN108573411A - 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 - Google Patents

基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 Download PDF

Info

Publication number
CN108573411A
CN108573411A CN201810342484.6A CN201810342484A CN108573411A CN 108573411 A CN108573411 A CN 108573411A CN 201810342484 A CN201810342484 A CN 201810342484A CN 108573411 A CN108573411 A CN 108573411A
Authority
CN
China
Prior art keywords
user
vector
text
user comment
paragraph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810342484.6A
Other languages
English (en)
Other versions
CN108573411B (zh
Inventor
张宜浩
朱小飞
徐传运
董世都
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiangsheng (Zhejiang) Data Management Co., Ltd.
Original Assignee
Chongqing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Technology filed Critical Chongqing University of Technology
Priority to CN201810342484.6A priority Critical patent/CN108573411B/zh
Publication of CN108573411A publication Critical patent/CN108573411A/zh
Application granted granted Critical
Publication of CN108573411B publication Critical patent/CN108573411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • Computing Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明提出了一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,包括如下步骤:S1,通过挖掘用户评论的情感倾向,实现基于用户综合评分的协同过滤推荐模型;S2,利用词向量和卷积神经网络实现对物品内容信息进行相似度计算;S3,利用协同训练的策略实现对多源推荐视图的融合,构建混合推荐模型。为利用用户评论等短文本信息挖掘情感倾向,解决用户评分的真实性问题提供解决方案;为解决对物品内容短文本描述的理解,多个视图的推荐模型的融合提供理论基础和技术手段。

Description

基于用户评论的深度情感分析和多源推荐视图融合的混合推 荐方法
技术领域
本发明涉及计算机领域,尤其涉及一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法。
背景技术
在电子商务、社交网络以及共享经济高速发展的今天,发现用户的需求、了解用户的行为、并为用户筛选出最相关的信息和物品是互联网服务的一个核心环节。个性化推荐作为一种帮助用户快速搜寻有用信息的工具,越来越受到人们的青睐。
传统的推荐算法通过根据用户对物品的评分进行协同过滤推荐。然而这种推荐方式受用户评分真实性的制约,依据用户评分产生推荐结果并不能准确地体现用户的偏好。通过比较用户评分和评论文本的情感倾向,指出用户评分并不能真实反映用户评论的情感倾向。现有技术对用户评分进行统计分析,发现用户对物品的评分比较随意、且评分等级分布极度不均衡;基于用户评论的个性化推荐被很多研究工作提及,但受文本挖掘和情感分析等技术的困扰,研究并不深入。
物品内容的描述文本通常较短,无足够的信息量供机器进行统计推断。传统的自然言语处理技术(如词袋模型)将文本表示成一个W维的独热向量,但这种独热表示假设所有对象都是相互独立的,容易受到数据稀疏问题的影响。
另一方面,由于评分(rating)相对于物品(item)的稀疏性,因此,基于模型的推荐通常缺乏足够的有标签数据。这就亟需本领域技术人员解决相应的技术问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法。
为了实现本发明的上述目的,本发明提供了一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,包括如下步骤:
S1,通过挖掘用户评论的情感倾向,实现基于用户综合评分的推荐模型;
S2,利用词向量和卷积神经网络实现对物品内容信息进行相似度计算;
S3,利用协同训练策略实现对多源推荐视图的融合,构建混合推荐模型。
所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1包括:
S1-1,用户评论信息的呈现形式通常是关键词和短文本,利用Word2Vec对用户评论短文本进行分布式表征;
S1-2,利用用户评论文本的词向量信息组建段落向量,从而实现基于段落向量的情感计算;
S1-3,通过基于词向量(Word2Vec)和长短期记忆网络(LSTM)的情感计算,对用户评论的文本信息进行情感分析建模。
所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1-1包括:
A,从外部收集大规模的用户评论文本,利用word2vec中的Skip-Gram模型或CBOW模型训练词向量模型,将每个词表示成K维向量实数值;
B,对于用户评论的短文本,在分词的基础上利用TF-IDF(词频-逆文档频率)算法抽取Top-N(前N个高频词)个词表示文本的情感,然后从词向量模型中查找得到每一个关键词的K维向量表示。
所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1-2包括:
在段落向量训练过程中,段落编码向量和词向量累加或者连接起来,作为输出层softmax的输入,利用梯度下降法训练新文档,直至收敛,从而得到文档的低维向量表示。在获得评论文本的段落向量(Paragraph Vector)后,将利用SK-Learn中的SGDClassifier构建分类器模型,实现对情感评分等级的预测;在此基础上,结合用户对物品的原始评分Scoreo,将二者进行加权求和,就可得到用户对该物品的情感倾向的综合评分Scorec=αScorer+(1-α)Scoreo,其中α是权重因子。
所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S1-3包括:
在用户评论的文本信息处理中,通常用的方法是循环神经网络(RNN);鉴于RNN在处理序过长序列时会导致优化时出现梯度消散的问题,本发明研究基于长短期记忆网络(LSTM)对用户评论的文本信息进行建模;本发明拟采用Word2Vec和LSTM对用户评论文本构建情感分类模型,实现对评论文本的评分等级的预测。
所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S2包括:
S2-1,假设两个给定物品的短文本描述为第一短文本ParagraphA和第二短文本ParagraphB,其段落长度分别为m和n;
S2-2,将ParagraphA和ParagraphB切割成3-Gram表达形式,于是短文本ParagraphA和ParagraphB就分别被切为;
SetA={w1w2w3,w2w3w4,...,wm-2wm-1wm},
SetB={w1w2w3,w2w3w4,...,wn-2wn-1wn};
S2-3,将SetA和SetB中的每一个字w用词向量vec进行表示,然后加权平均作为该语言片段的向量,则SetA和SetB就能够表示为语言片段向量Set2VecA={vec1,vec2,...,vecm}和Set2VecB={vec1,vec2,...,vecn};
S2-4,将Set2VecA的元素和Set2VecB的元素分别作为矩阵的行和列,组成一个m×n的矩阵,其中矩阵的每一个单元格用横纵坐标对应向量的相似度来填充,得到用户评论文本的相似度矩阵;
在获得大量的基于词向量的用户评论相似度矩阵后,就能够利用卷积神经网络构建基于物品内容的相似度计算模型;将来自于相似物品集的物品文本描述构建的矩阵作为训练数据集的正例,将来自非相似物品集的物品文本描述构建的矩阵作为训练数据集的负例,组成整个神经网络模型的训练数据集。
所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,优选的,所述S3包括:
S3-1,在构建基于协同训练的混合推荐模型时,利用基于置信度估计与聚类分析的数据选择算法对数据进行过滤,然后利用贡献度计算方法选择对分类器结果贡献度大的样本加入迭代训练;
S3-2,用平均绝对误差(MAE)对用户评分模型的性能进行评估,假定测试集中的用户u和物品i,rui是用户u对物品i的实际评分,而是预测评分,则MAE是定义为:
综上所述,由于采用了上述技术方案,本发明的有益效果是:
本发明的实施,为利用用户评论等短文本信息挖掘情感倾向,解决用户评分的真实性问题提供解决方案;为解决对物品内容短文本描述的理解,多个视图的推荐模型的融合提供理论基础和技术手段。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明总体设计流程图;
图2是本发明用户评论的词向量分布式表征;
图3是本发明基于Word2Vec和LSTM的情感分析模型;
图4是基于词向量的用户评论相似度矩阵构建流程;
图5是本发明基于协同训练的混合推荐预测模型。
具体实施方式
下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
通过挖掘用户评论的情感倾向,实现基于用户综合评分的协同过滤推荐模型;利用词向量和神经网络实现对物品的内容信息建模;然后利用协同训练的策略实现对两种推荐模型的融合,构建混合推荐模型。总体设计路线如图1所示:
基于用户评论情感分析的综合评分度量
在推荐系统中,用户评论信息的呈现形式通常是关键词和短文本,这些短文本通常不遵循语法规则,且长度短、没有足够的信息量来进行统计推断,传统的自然语言处理技术(如词性标注、句法分析等)难以直接应用于短文本分析。因此本发明拟采用基于词向量的关键词表示方法,解决传统稀疏表示方式的维数灾难,且无法表示语义信息的问题,同时也挖掘了词之间的关联属性,从而提高了关键词语义的准确度。
(1)用户评论短文本的词向量(Word2Vec)分布式表征
本发明利用Word2vec自动从大规模无标注用户评论中学习到句法和语义信息,是一种能够进行高效率词嵌套学习的预测模型,其能够实现对用户评论中关键词的表征。用户评论的词向量分布式表征如图2所示:
在图2中,利用Word2vec对用户评论的短文本信息进行向量表示,主要分为以下两个步骤:
1)从外部收集大规模的用户评论文本,利用word2vec中的Skip-Gram模型或CBOW模型训练词向量模型,将每个词表示成K维向量实数值。
2)对于用户评论的短文本,在分词的基础上利用TF-IDF等算法抽取Top-N个词表示文本的情感,然后从词向量模型中查找得到每一个关键词的K维向量表示。
在得到每个关键词的K维实数向量表示后,一种可行的方案是将关键词的向量进行加权平均作为用户评论文本的向量表示,从而实现评论文本信息的情感分析。
(2)基于段落向量(Paragraph Vector)的情感计算
段落向量表示是它将短文本向量当作“语境”用于辅助推理,在极大似然估计中,文本向量亦被作为模型参数进行更新。在模型训练过程中新增了段落编码,即训练语料中每个句子都有一个唯一的编码。段落编码和普通的词一样,也是先映射成一个向量。在段落向量计算中,段落编码向量和词向量累加或者连接起来,作为输出层softmax的输入,利用梯度下降法训练新文档,直至收敛,从而得到文档的低维向量表示。
在获得评论文本的Paragraph Vector后,将利用SK-Learn中的SGDClassifier构建分类器模型,实现对情感评分等级的预测。在此基础上,结合用户对物品的原始评分Scoreo,将二者进行加权求和,就可得到用户对该物品的情感倾向的综合评分Scorec=αScorer+(1-α)Scoreo,其中α是权重因子。Scorer表示模型的预测评分等级。
(3)基于词向量(Word2Vec)和长短期记忆网络(LSTM)的情感计算
在用户评论的文本信息处理中,通常用的方法是循环神经网络(RNN)。鉴于RNN在处理序过长序列时会导致优化时出现梯度消散的问题,本发明研究基于长短期记忆网络(LSTM)对用户评论的文本信息进行建模。本发明拟采用Word2Vec和LSTM对用户评论文本构建情感分类模型,实现对评论文本的评分等级的预测,如图3所示。
基于多视图融合的混合推荐预测模型
本发明通过对物品内容的短文本进行相似度计算,构建基于物品内容的推荐模型;利用用户的综合评分构建基于物品的协同过滤推荐模型;然后利用协同训练策略对两个推荐模型进行融合。主要涉及以下三个关键步骤:
(1)基于词向量和卷积神经网络的物品内容相似度计算
基于词向量和卷积神经网络的物品相似度计算如图4所示,其步骤如下:
1)假设两个给定物品的短文本描述为第一短文本ParagraphA和第二短文本ParagraphB,其段落长度分别为m和n;
2)将ParagraphA和ParagraphB切割成3-Gram表达形式,于是短文本ParagraphA和ParagraphB就分别被切为;
SetA={w1w2w3,w2w3w4,...,wm-2wm-1wm},
SetB={w1w2w3,w2w3w4,...,wn-2wn-1wn};
3)将SetA和SetB中的每一个字w用词向量vec进行表示,然后加权平均作为该语言片段的向量,则SetA和SetB就能够表示为语言片段向量Set2VecA={vec1,vec2,...,vecm}和Set2VecB={vec1,vec2,...,vecn};
4)将Set2VecA的元素和Set2VecB的元素分别作为矩阵的行和列,组成一个m×n的矩阵,其中矩阵的每一个单元格用横纵坐标对应向量的相似度来填充,得到用户评论文本的相似度矩阵;
在获得大量的基于词向量的用户评论相似度矩阵后,就能够利用卷积神经网络构建基于物品内容的相似度计算模型。将来自于相似物品集的物品文本描述构建的矩阵作为训练数据集的正例,将来自非相似物品集的物品文本描述构建的矩阵作为训练数据集的负例,组成整个神经网络模型的训练数据集。
(2)基于协同训练的混合推荐预测模型
在构建混合推荐方法时,本发明拟利用用户综合评分“视图”,构建基于物品的协同过滤推荐模型;利用物品内容的文本信息“视图”,构建基于物品内容的推荐模型;最后协同训练的方法对两个推荐模型进行融合。在协同训练的数据选择方面,利用基于置信度估计与聚类分析的数据选择算法对数据进行过滤,然后基于贡献度计算方法选择预测样本加入新的迭代。基于协同训练的混合推荐预测模型的框架如图5所示:针对在电商网站上收集的数据集,分别利用词袋(Bag-of-Words)、2-Gram词袋(Bag-of-bigrams)、平均词向量(Vector Averaging)、段落向量表示(Paragraph Vector)4种文本表示方法对用户评论的短文本进行表示,利用LibSVM训练情感分类模型,得到的分类准确率,从图中数据来看,利用段落向量表示的方法达到了较高的分类准确率。
同时,也考虑用平均绝对误差(MAE)对用户评分模型的性能进行评估。假定测试集中的用户u和物品i,rui是用户u对物品i的实际评分,而是预测评分,则MAE是定义为:其中T为用户u对物品i的评分个数。
本发明从用户评论的情感倾向挖掘入手,分别利用基于段落向量和基于Word2Vec+LSTM建模的方法对评论文本进行情感分析,对用户评分进行综合度量,进而实现基于物品的协同过滤推荐;然后研究基于词向量和卷积神经网络的物品相似度计算方法,实现基于物品内容的推荐,并利用协同训练策略实现上述两种推荐模型的融合,从而构建混合推荐模型。
基于用户评论情感分析的综合评分度量,用户评分作为一种显式的用户行为反馈,是计算推荐列表的重要依据。鉴于用户评分与用户真实兴趣偏好存在较大的偏差、及评分等级分布的不均衡,利用用户评论信息对用户评分进行重新度量是研究的热点。然而用户评论的文本通常较短,传统的自然语言处理技术难以直接对其进行分析。因此,本发明拟利用文本的分布式表征方法挖掘用户评论的情感倾向信息,同时结合用户的原始评分,实现对用户评分的综合度量。具体研究:
(1)用户评论短文本的词向量(Word2Vec)分布式表征。研究基于CBOW和Skip-gram模型的词向量表示方法,实现对用户评论文本中的关键词的向量表示。
(2)基于段落向量(Paragraph Vector)的情感计算。词向量表示只是基于词的维度进行“语义分析”,而并不具有上下文的“语义分析”能力。本发明研究基于分布式记忆模型的段落向量表示方法,进而实现基于段落向量表示的情感计算,将评论文本转化为用户的综合评分。
(3)基于词向量(Word2Vec)和长短期记忆网络(LSTM)的情感计算。鉴于循环神经网络(RNN)在处理序过长序列时会导致优化时出现梯度消散的问题,本发明研究基于Word2Vec+LSTM的情感计算方法,进而将评论文本转化为用户的综合评分。
基于多视图融合的混合推荐预测模型
在推荐方法中,利用多个推荐模型构建混合推荐方法是提升系统性能的重要途径。针对训练推荐模型时有标签数据不足的问题,本发明拟利用协同训练的方法对多个视图的推荐因素进行融合。具体研究:
(1)基于词向量和卷积神经网络的物品相似度计算。研究物品内容的短文本的关键词提取方法,及关键词的向量表示方法;在此基础上,研究基于向量表示的N-Gram短语的相似度计算、及基于卷积神经网络的物品内容的相似度计算。
(2)基于协同训练的多视图融合的推荐模型。研究基于综合用户评分的物品协同过滤推荐模型和基于物品内容的推荐模型;在此基础上,研究基于协同训练的多个视图的推荐模型的融合,进而构建混合推荐方法。
本发明有益效果为:
(1)针对用户评分与真实兴趣偏好存在偏差、且评分等级不均衡问题,研究基于用户评论的短文本情感计算方法,实现对用户评分的综合度量。
(2)针对传统的自然语言处理技术难以对物品内容的短文本进行有效分析的问题,研究基于词向量和神经网络的建模方法,实现对物品内容的相似度计算。
(3)针对机器学习方法缺乏足够的有标签数据建模的问题,研究基于协同训练的多视图融合方法,实现多种推荐因素的混合建模。

Claims (7)

1.一种基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,包括如下步骤:
S1,通过挖掘用户评论的情感倾向,实现基于用户综合评分的推荐模型;
S2,利用词向量和卷积神经网络实现对物品内容信息进行相似度计算;
S3,利用协同训练策略实现对多源推荐视图的融合,构建混合推荐模型。
2.根据权利要求1所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1包括:
S1-1,用户评论信息的呈现形式通常是关键词和短文本,利用Word2Vec对用户评论短文本进行分布式表征;
S1-2,利用用户评论文本的词向量信息组建段落向量,从而实现基于段落向量的情感计算;
S1-3,通过基于词向量(Word2Vec)和长短期记忆网络(LSTM)的情感计算,对用户评论的文本信息进行情感分析建模。
3.根据权利要求2所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1-1包括:
A,从外部收集大规模的用户评论文本,利用word2vec中的Skip-Gram模型或CBOW模型训练词向量模型,将每个词表示成K维向量实数值;
B,对于用户评论的短文本,在分词的基础上利用TF-IDF(词频-逆文档频率)算法抽取Top-N(前N个高频词)个词表示文本的情感,然后从词向量模型中查找得到每一个关键词的K维向量表示。
4.根据权利要求2所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1-2包括:
在段落向量训练过程中,段落编码向量和词向量累加或者连接起来,作为输出层softmax的输入,利用梯度下降法训练新文档,直至收敛,从而得到文档的低维向量表示。在获得评论文本的段落向量(Paragraph Vector)后,将利用SK-Learn中的SGDClassifier构建分类器模型,实现对情感评分等级的预测;在此基础上,结合用户对物品的原始评分Scoreo,将二者进行加权求和,就可得到用户对该物品的情感倾向的综合评分Scorec=αScorer+(1-α)Scoreo,其中α是权重因子。
5.根据权利要求2所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S1-3包括:
在用户评论的文本信息处理中,通常用的方法是循环神经网络(RNN);鉴于RNN在处理序过长序列时会导致优化时出现梯度消散的问题,本发明研究基于长短期记忆网络(LSTM)对用户评论的文本信息进行建模;本发明拟采用Word2Vec和LSTM对用户评论文本构建情感分类模型,实现对评论文本的评分等级的预测。
6.根据权利要求1所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S2包括:
S2-1,假设两个给定物品的短文本描述为第一短文本ParagraphA和第二短文本ParagraphB,其段落长度分别为m和n;
S2-2,将ParagraphA和ParagraphB切割成3-Gram表达形式,于是短文本ParagraphA和ParagraphB就分别被切为;
SetA={w1w2w3,w2w3w4,...,wm-2wm-1wm},
SetB={w1w2w3,w2w3w4,...,wn-2wn-1wn};
S2-3,将SetA和SetB中的每一个字w用词向量vec进行表示,然后加权平均作为该语言片段的向量,则SetA和SetB就能够表示为语言片段向量Set2VecA={vec1,vec2,...,vecm}和Set2VecB={vec1,vec2,...,vecn};
S2-4,将Set2VecA的元素和Set2VecB的元素分别作为矩阵的行和列,组成一个m×n的矩阵,其中矩阵的每一个单元格用横纵坐标对应向量的相似度来填充,得到用户评论文本的相似度矩阵;
在获得大量的基于词向量的用户评论相似度矩阵后,就能够利用卷积神经网络构建基于物品内容的相似度计算模型;将来自于相似物品集的物品文本描述构建的矩阵作为训练数据集的正例,将来自非相似物品集的物品文本描述构建的矩阵作为训练数据集的负例,组成整个神经网络模型的训练数据集。
7.根据权利要求1所述的基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法,其特征在于,所述S3包括:
S3-1,在构建基于协同训练的混合推荐模型时,利用基于置信度估计与聚类分析的数据选择算法对数据进行过滤,然后利用贡献度计算方法选择对分类器结果贡献度大的样本加入迭代训练;
S3-2,用平均绝对误差(MAE)对用户评分模型的性能进行评估,假定测试集中的用户u和物品i,rui是用户u对物品i的实际评分,而是预测评分,则MAE是定义为:
CN201810342484.6A 2018-04-17 2018-04-17 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法 Active CN108573411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810342484.6A CN108573411B (zh) 2018-04-17 2018-04-17 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810342484.6A CN108573411B (zh) 2018-04-17 2018-04-17 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法

Publications (2)

Publication Number Publication Date
CN108573411A true CN108573411A (zh) 2018-09-25
CN108573411B CN108573411B (zh) 2021-09-21

Family

ID=63574959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810342484.6A Active CN108573411B (zh) 2018-04-17 2018-04-17 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法

Country Status (1)

Country Link
CN (1) CN108573411B (zh)

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360058A (zh) * 2018-10-12 2019-02-19 平安科技(深圳)有限公司 基于信任网络的推送方法、装置、计算机设备及存储介质
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN109582864A (zh) * 2018-11-19 2019-04-05 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109635291A (zh) * 2018-12-04 2019-04-16 重庆理工大学 一种基于协同训练的融合评分信息和物品内容的推荐方法
CN109669968A (zh) * 2018-12-14 2019-04-23 西北工业大学 一种基于计量经济学的移动应用评论分析与挖掘方法
CN109683946A (zh) * 2018-12-13 2019-04-26 南开大学 一种基于代码克隆技术的用户评论推荐方法
CN109710840A (zh) * 2018-12-17 2019-05-03 北京百度网讯科技有限公司 文章内容深度的评估方法及装置
CN109783800A (zh) * 2018-12-13 2019-05-21 北京百度网讯科技有限公司 情感关键词的获取方法、装置、设备及存储介质
CN109933648A (zh) * 2019-02-28 2019-06-25 北京学之途网络科技有限公司 一种真实用户评论的区分方法和区分装置
CN110046342A (zh) * 2019-02-19 2019-07-23 阿里巴巴集团控股有限公司 一种文本质量检测方法
CN110083684A (zh) * 2019-04-24 2019-08-02 吉林大学 面向细粒度情感的可解释推荐模型
CN110134868A (zh) * 2019-05-14 2019-08-16 辽宁工程技术大学 一种基于用户偏好异构性分析的推荐方法
CN110162706A (zh) * 2019-05-22 2019-08-23 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统
CN110334759A (zh) * 2019-06-28 2019-10-15 武汉大学 一种评论驱动的深度序列推荐方法
CN110377841A (zh) * 2019-06-04 2019-10-25 深思考人工智能机器人科技(北京)有限公司 一种应用在协同过滤方法中的相似度计算方法及系统
CN110390046A (zh) * 2019-06-04 2019-10-29 深思考人工智能机器人科技(北京)有限公司 一种协同过滤推荐方法及系统
CN110633363A (zh) * 2019-09-18 2019-12-31 桂林电子科技大学 一种基于nlp和模糊多准则决策的文本实体推荐方法
TWI681308B (zh) * 2018-11-01 2020-01-01 財團法人資訊工業策進會 文章的回應預測裝置及方法
CN110851718A (zh) * 2019-11-11 2020-02-28 重庆邮电大学 一种基于长短时记忆网络以及用户评论的电影推荐方法
CN110941704A (zh) * 2019-12-13 2020-03-31 上海德拓信息技术股份有限公司 一种文本内容相似度分析的方法
CN111314716A (zh) * 2018-12-11 2020-06-19 阿里巴巴集团控股有限公司 直播的处理方法、装置、系统以及实时数据处理方法
CN111339439A (zh) * 2020-02-18 2020-06-26 广东工业大学 一种融合评论文本与时序效应的协同过滤推荐方法和装置
CN111460261A (zh) * 2020-04-13 2020-07-28 同济大学 一种多平台网络录播课程整合平台及方法
CN111639184A (zh) * 2020-06-01 2020-09-08 复旦大学 评分与评论内容的倾向不一致性检测系统
CN111859165A (zh) * 2020-06-18 2020-10-30 达而观信息科技(上海)有限公司 一种基于用户行为的实时个性化信息流推荐方法
CN112084416A (zh) * 2020-09-21 2020-12-15 哈尔滨理工大学 基于CNN和LSTM的Web服务推荐方法
CN112100517A (zh) * 2020-09-17 2020-12-18 哈尔滨理工大学 一种基于内容特征抽取的缓解推荐系统冷启动问题的方法
CN112115368A (zh) * 2020-09-29 2020-12-22 安徽访得信息科技有限公司 一种基于大数据的内容信息分发引擎的方法
CN112182156A (zh) * 2020-09-28 2021-01-05 齐鲁工业大学 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN112231577A (zh) * 2020-11-06 2021-01-15 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112667919A (zh) * 2020-12-28 2021-04-16 山东大学 一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法
CN113010572A (zh) * 2021-03-18 2021-06-22 杭州码全信息科技有限公司 基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法
CN113158023A (zh) * 2021-02-05 2021-07-23 杭州码全信息科技有限公司 基于混合推荐算法的公共数字生活精准分类服务方法
CN113220917A (zh) * 2020-02-06 2021-08-06 阿里巴巴集团控股有限公司 一种背景图推荐方法、设备及存储介质
CN113241193A (zh) * 2021-06-01 2021-08-10 平安科技(深圳)有限公司 药物推荐模型训练方法、推荐方法、装置、设备及介质
CN113254777A (zh) * 2021-06-07 2021-08-13 武汉卓尔数字传媒科技有限公司 信息推荐方法、装置、电子设备及存储介质
CN113268667A (zh) * 2021-05-28 2021-08-17 汕头大学 一种基于中文评论情感引导的序列推荐方法及系统
CN113672798A (zh) * 2020-05-15 2021-11-19 第四范式(北京)技术有限公司 基于协同滤波模型的物品推荐方法和系统
CN113869034A (zh) * 2021-09-29 2021-12-31 重庆理工大学 基于强化依赖图的方面情感分类方法
CN116245555A (zh) * 2023-03-09 2023-06-09 清瑞网络科技(山东)有限责任公司 一种基于大数据的用户信息收集分析系统
CN117934126A (zh) * 2024-03-25 2024-04-26 珠海芯烨电子科技有限公司 一种基于用户情感分析的个性化目标信息推荐系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120071194A (ko) * 2010-12-22 2012-07-02 주식회사 케이티 사용자 리뷰를 이용한 컨텐츠 추천 장치 및 그 방법
CN105069072A (zh) * 2015-07-30 2015-11-18 天津大学 基于情感分析的混合用户评分信息推荐方法及其推荐装置
CN107544957A (zh) * 2017-07-05 2018-01-05 华北电力大学 一种面向商品目标词的情感倾向分析方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120071194A (ko) * 2010-12-22 2012-07-02 주식회사 케이티 사용자 리뷰를 이용한 컨텐츠 추천 장치 및 그 방법
CN105069072A (zh) * 2015-07-30 2015-11-18 天津大学 基于情感分析的混合用户评分信息推荐方法及其推荐装置
CN107544957A (zh) * 2017-07-05 2018-01-05 华北电力大学 一种面向商品目标词的情感倾向分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杨锡慧: "基于融合卷积神经网络的协同过滤模型", 《软件导刊》 *

Cited By (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109360058A (zh) * 2018-10-12 2019-02-19 平安科技(深圳)有限公司 基于信任网络的推送方法、装置、计算机设备及存储介质
CN109522474B (zh) * 2018-10-19 2021-05-18 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
CN109522474A (zh) * 2018-10-19 2019-03-26 上海交通大学 基于交互序列数据挖掘深度用户相似性的推荐方法
TWI681308B (zh) * 2018-11-01 2020-01-01 財團法人資訊工業策進會 文章的回應預測裝置及方法
CN109582864B (zh) * 2018-11-19 2020-11-10 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109582864A (zh) * 2018-11-19 2019-04-05 华南师范大学 基于大数据科学和动态权重调整的课程推荐方法及系统
CN109635291A (zh) * 2018-12-04 2019-04-16 重庆理工大学 一种基于协同训练的融合评分信息和物品内容的推荐方法
CN109635291B (zh) * 2018-12-04 2023-04-25 重庆理工大学 一种基于协同训练的融合评分信息和物品内容的推荐方法
CN111314716A (zh) * 2018-12-11 2020-06-19 阿里巴巴集团控股有限公司 直播的处理方法、装置、系统以及实时数据处理方法
CN111314716B (zh) * 2018-12-11 2022-06-03 阿里巴巴集团控股有限公司 直播的处理方法、装置、系统以及实时数据处理方法
CN109683946A (zh) * 2018-12-13 2019-04-26 南开大学 一种基于代码克隆技术的用户评论推荐方法
CN109783800A (zh) * 2018-12-13 2019-05-21 北京百度网讯科技有限公司 情感关键词的获取方法、装置、设备及存储介质
CN109683946B (zh) * 2018-12-13 2021-12-03 南开大学 一种基于代码克隆技术的用户评论推荐方法
CN109783800B (zh) * 2018-12-13 2024-04-12 北京百度网讯科技有限公司 情感关键词的获取方法、装置、设备及存储介质
CN109669968A (zh) * 2018-12-14 2019-04-23 西北工业大学 一种基于计量经济学的移动应用评论分析与挖掘方法
CN109669968B (zh) * 2018-12-14 2022-09-23 西北工业大学 一种基于计量经济学的移动应用评论分析与挖掘方法
CN109710840B (zh) * 2018-12-17 2020-12-11 北京百度网讯科技有限公司 文章内容深度的评估方法及装置
CN109710840A (zh) * 2018-12-17 2019-05-03 北京百度网讯科技有限公司 文章内容深度的评估方法及装置
CN110046342A (zh) * 2019-02-19 2019-07-23 阿里巴巴集团控股有限公司 一种文本质量检测方法
CN109933648B (zh) * 2019-02-28 2022-07-05 北京学之途网络科技有限公司 一种真实用户评论的区分方法和区分装置
CN109933648A (zh) * 2019-02-28 2019-06-25 北京学之途网络科技有限公司 一种真实用户评论的区分方法和区分装置
CN110083684B (zh) * 2019-04-24 2021-11-19 吉林大学 面向细粒度情感的可解释推荐模型
CN110083684A (zh) * 2019-04-24 2019-08-02 吉林大学 面向细粒度情感的可解释推荐模型
CN110134868A (zh) * 2019-05-14 2019-08-16 辽宁工程技术大学 一种基于用户偏好异构性分析的推荐方法
CN110162706A (zh) * 2019-05-22 2019-08-23 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统
CN110162706B (zh) * 2019-05-22 2021-10-26 南京邮电大学 一种基于交互数据聚类的个性化推荐方法及系统
CN110377841A (zh) * 2019-06-04 2019-10-25 深思考人工智能机器人科技(北京)有限公司 一种应用在协同过滤方法中的相似度计算方法及系统
CN110390046A (zh) * 2019-06-04 2019-10-29 深思考人工智能机器人科技(北京)有限公司 一种协同过滤推荐方法及系统
CN110377841B (zh) * 2019-06-04 2022-01-07 深思考人工智能机器人科技(北京)有限公司 一种应用在协同过滤方法中的相似度计算方法及系统
CN110334759A (zh) * 2019-06-28 2019-10-15 武汉大学 一种评论驱动的深度序列推荐方法
CN110334759B (zh) * 2019-06-28 2022-09-23 武汉大学 一种评论驱动的深度序列推荐方法
CN110633363A (zh) * 2019-09-18 2019-12-31 桂林电子科技大学 一种基于nlp和模糊多准则决策的文本实体推荐方法
CN110851718B (zh) * 2019-11-11 2022-06-28 重庆邮电大学 一种基于长短时记忆网络以及用户评论的电影推荐方法
CN110851718A (zh) * 2019-11-11 2020-02-28 重庆邮电大学 一种基于长短时记忆网络以及用户评论的电影推荐方法
CN110941704A (zh) * 2019-12-13 2020-03-31 上海德拓信息技术股份有限公司 一种文本内容相似度分析的方法
CN110941704B (zh) * 2019-12-13 2023-11-03 上海德拓信息技术股份有限公司 一种文本内容相似度分析的方法
CN113220917B (zh) * 2020-02-06 2022-04-12 阿里巴巴集团控股有限公司 一种背景图推荐方法、设备及存储介质
CN113220917A (zh) * 2020-02-06 2021-08-06 阿里巴巴集团控股有限公司 一种背景图推荐方法、设备及存储介质
CN111339439A (zh) * 2020-02-18 2020-06-26 广东工业大学 一种融合评论文本与时序效应的协同过滤推荐方法和装置
CN111339439B (zh) * 2020-02-18 2023-05-09 广东工业大学 一种融合评论文本与时序效应的协同过滤推荐方法和装置
CN111460261A (zh) * 2020-04-13 2020-07-28 同济大学 一种多平台网络录播课程整合平台及方法
CN113672798A (zh) * 2020-05-15 2021-11-19 第四范式(北京)技术有限公司 基于协同滤波模型的物品推荐方法和系统
CN111639184A (zh) * 2020-06-01 2020-09-08 复旦大学 评分与评论内容的倾向不一致性检测系统
CN111859165A (zh) * 2020-06-18 2020-10-30 达而观信息科技(上海)有限公司 一种基于用户行为的实时个性化信息流推荐方法
CN112100517A (zh) * 2020-09-17 2020-12-18 哈尔滨理工大学 一种基于内容特征抽取的缓解推荐系统冷启动问题的方法
CN112084416A (zh) * 2020-09-21 2020-12-15 哈尔滨理工大学 基于CNN和LSTM的Web服务推荐方法
CN112182156B (zh) * 2020-09-28 2023-02-07 齐鲁工业大学 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN112182156A (zh) * 2020-09-28 2021-01-05 齐鲁工业大学 基于文本处理的方面级可解释深度网络评分预测推荐方法
CN112115368A (zh) * 2020-09-29 2020-12-22 安徽访得信息科技有限公司 一种基于大数据的内容信息分发引擎的方法
CN112231577B (zh) * 2020-11-06 2022-06-03 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112231577A (zh) * 2020-11-06 2021-01-15 重庆理工大学 一种融合文本语义向量和神经协同过滤的推荐方法
CN112667919A (zh) * 2020-12-28 2021-04-16 山东大学 一种基于文本数据的个性化社区矫正方案推荐系统及其工作方法
CN113158023A (zh) * 2021-02-05 2021-07-23 杭州码全信息科技有限公司 基于混合推荐算法的公共数字生活精准分类服务方法
CN113010572A (zh) * 2021-03-18 2021-06-22 杭州码全信息科技有限公司 基于深度贝叶斯网络的公共数字生活场景规则模型预测预警方法
CN113268667A (zh) * 2021-05-28 2021-08-17 汕头大学 一种基于中文评论情感引导的序列推荐方法及系统
CN113241193A (zh) * 2021-06-01 2021-08-10 平安科技(深圳)有限公司 药物推荐模型训练方法、推荐方法、装置、设备及介质
CN113254777A (zh) * 2021-06-07 2021-08-13 武汉卓尔数字传媒科技有限公司 信息推荐方法、装置、电子设备及存储介质
CN113869034A (zh) * 2021-09-29 2021-12-31 重庆理工大学 基于强化依赖图的方面情感分类方法
CN116245555A (zh) * 2023-03-09 2023-06-09 清瑞网络科技(山东)有限责任公司 一种基于大数据的用户信息收集分析系统
CN116245555B (zh) * 2023-03-09 2023-12-08 张家口巧工匠科技服务有限公司 一种基于大数据的用户信息收集分析系统
CN117934126A (zh) * 2024-03-25 2024-04-26 珠海芯烨电子科技有限公司 一种基于用户情感分析的个性化目标信息推荐系统

Also Published As

Publication number Publication date
CN108573411B (zh) 2021-09-21

Similar Documents

Publication Publication Date Title
CN108573411A (zh) 基于用户评论的深度情感分析和多源推荐视图融合的混合推荐方法
CN109635291B (zh) 一种基于协同训练的融合评分信息和物品内容的推荐方法
CN106776581B (zh) 基于深度学习的主观性文本情感分析方法
CN111914096A (zh) 基于舆情知识图谱的公共交通乘客满意度评价方法及系统
Boltužić et al. Fill the gap! analyzing implicit premises between claims from online debates
CN109493166A (zh) 一种针对电子商务导购场景任务型对话系统的构建方法
CN110162636A (zh) 基于d-lstm的文本情绪原因识别方法
CN105975625A (zh) 一种面向英文搜索引擎的中式英文查询纠错方法和系统
CN101127042A (zh) 一种基于语言模型的情感分类方法
CN103631859A (zh) 一种面向科技项目的评审专家智能推荐方法
CN105069072A (zh) 基于情感分析的混合用户评分信息推荐方法及其推荐装置
CN112966091B (zh) 一种融合实体信息与热度的知识图谱推荐系统
CN105843796A (zh) 一种微博情感倾向分析方法及装置
CN113360582B (zh) 基于bert模型融合多元实体信息的关系分类方法及系统
CN111966888B (zh) 融合外部数据的基于方面类别的可解释性推荐方法及系统
CN111709244A (zh) 一种用于矛盾纠纷事件因果关系识别的深度学习方法
CN113312922B (zh) 一种改进的篇章级三元组信息抽取方法
CN106649250A (zh) 一种情感新词的识别方法及装置
CN110110220B (zh) 融合社交网络和用户评价的推荐模型
CN110321434A (zh) 一种基于词义消歧卷积神经网络的文本分类方法
CN113901208A (zh) 融入主题特征的中越跨语言评论情感倾向性分析方法
CN104794209A (zh) 基于马尔科夫逻辑网络的中文微博情绪分类方法及系统
CN111382333B (zh) 基于案件相关性联合学习与图卷积的新闻文本句中案件要素抽取方法
CN103699568B (zh) 一种从维基中抽取领域术语间上下位关系的方法
CN112380844A (zh) 武器装备属性同义词扩展方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220810

Address after: 310000 room 713-2, building 3, Haichuang technology center, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Patentee after: Xiangsheng (Zhejiang) Data Management Co., Ltd.

Address before: No.69-1, Hongguang Avenue, Banan District, Chongqing 400054

Patentee before: Chongqing University of Technology