CN109684636A - 一种基于深度学习的用户情感分析方法 - Google Patents

一种基于深度学习的用户情感分析方法 Download PDF

Info

Publication number
CN109684636A
CN109684636A CN201811565931.0A CN201811565931A CN109684636A CN 109684636 A CN109684636 A CN 109684636A CN 201811565931 A CN201811565931 A CN 201811565931A CN 109684636 A CN109684636 A CN 109684636A
Authority
CN
China
Prior art keywords
term vector
deep learning
classification
method based
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811565931.0A
Other languages
English (en)
Other versions
CN109684636B (zh
Inventor
李祖贺
尚松涛
支俊
马江涛
杨学东
王凤琴
于源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou University of Light Industry
Original Assignee
Zhengzhou University of Light Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Light Industry filed Critical Zhengzhou University of Light Industry
Priority to CN201811565931.0A priority Critical patent/CN109684636B/zh
Publication of CN109684636A publication Critical patent/CN109684636A/zh
Application granted granted Critical
Publication of CN109684636B publication Critical patent/CN109684636B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于深度学习的用户情感分析方法,包括以下步骤;构建词汇表;使用分类器进行分类选中一部分作为种子词典,并且给出这些种子语料的情感极性得分词典,改进相应的TF‑IDF特征选择过程;分别将新改进得到的TF‑IDF特征词向量与Word2vec特征词向量的结果保存起来;对于每种情感分类的情感种子词语进行加和求平均得到每种情感的中心词向量的极性的概率。本发明提供了一种基于深度学习的用户情感分析方法,结合基本的词频特征选择算法,Word2vec算法将文本的词频信息,情感信息,语义信息有效的结合起来并且将新构建的情感语义词向量与原来的词向量进行了对比试验,有效的证明了情感语义词向量的有效性。

Description

一种基于深度学习的用户情感分析方法
技术领域
本发明涉及情感分析技术领域,具体为一种基于深度学习的用户情感分析方法。
背景技术
互联网作为人们信息交流与资源共享的平台,保存了大量含有主观信息的数据,如何从这些海量的数据中提取出人们的兴趣,携带观点的文本,并对其进行情感分类是目前研究的热点之一;
传统的用于解决情感分析问题的方法包括基于情感词典和人工判定规则的无监督方法、基于机器学习的有监督方法,在数据量不大或者语义不够丰富的时候,这些方法能够取得一定的效果,但是随着数据量越来越大、表达方式越来越丰富,传统的方法已经无法有效地解决这一类问题,新的方法亟待提出。
发明内容
本发明的目的在于提供一种基于深度学习的用户情感分析方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种基于深度学习的用户情感分析方法,包括以下步骤;
步骤一、构建词汇表,将语料库的文本词语进行预训练,根据分析对象的性质构造特征向量获取模型,并且分别得到对应的TF-IDF和Word2vec特征词向量;
步骤二、使用分类器进行分类选中一部分作为种子词典,并且给出这些种子语料的情感极性得分词典,改进相应的TF-IDF特征选择过程,得到新的改进的TF-IDF特征选择词向量;
步骤三、分别将新改进得到的TF-IDF特征词向量与Word2vec特征词向量的结果保存起来;
步骤四、对于每种情感分类的情感种子词语进行加和求平均得到每种情感的中心词向量的极性的概率;
S1、对相邻的每3-5个词汇的向量相加,取平均值,放入输入层;
S2、通过使用计算方法产生输出,采用输出的最好一个向量作为分类的依据;
S3、通过将softmax层与RNN的输出进行全连接,获得情感极性的概率;
步骤五、将得到的概率值与真实值进行比较后,使用交叉熵函数作为损失函数,并且计算损值的大小,然后通过adam算法计算梯度,并用对模型进行参数调整;
步骤六、带模型进行收敛并导出模型,用于测试集的情感分类;
步骤七、找到每个词汇对应的词向量,放入输入层产生输出得到各个类别对应的概率值,并使用贪婪算法确定词汇的类别。
优选的,步骤四中,计算方法为LSTM-RNN的计算方法。
优选的,步骤四中,计算方法为GRU-RNN的计算方法。
优选的,步骤四中,输入层是表示输入词汇量序列,这些向量是通过Word2vec或者随机词向量产生。
优选的,步骤五中,使用交叉熵函数作为损失函数时,通过BPTT更新参数。
与现有技术相比,本发明的有益效果是:本发明提供了一种基于深度学习的用户情感分析方法,1、结合基本的词频特征选择算法,Word2vec算法将文本的词频信息,情感信息,语义信息有效的结合起来并且将新构建的情感语义词向量与原来的词向量进行了对比试验,有效的证明了情感语义词向量的有效性;
2、通过针对每一特征向量训练独立的子网络进行降维,减少了整个神经网络的训练时间,同时保证特征向量的主要分量不会被筛除,保证了分类效果,除抽取方面词专有特征外,利用情感相关特征向量构造方法构造了可重复使用的特征向量,使用进行方面级别评论情感分析的过程总体速度大大提高,有较强的实用性。
具体实施方式
下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
本发明提供一种技术方案:一种基于深度学习的用户情感分析方法,包括以下步骤;
步骤一、构建词汇表,将语料库的文本词语进行预训练,根据分析对象的性质构造特征向量获取模型,并且分别得到对应的TF-IDF和Word2vec特征词向量;
步骤二、使用分类器进行分类选中一部分作为种子词典,并且给出这些种子语料的情感极性得分词典,改进相应的TF-IDF特征选择过程,得到新的改进的TF-IDF特征选择词向量;
步骤三、分别将新改进得到的TF-IDF特征词向量与Word2vec特征词向量的结果保存起来;
步骤四、对于每种情感分类的情感种子词语进行加和求平均得到每种情感的中心词向量的极性的概率;
S1、对相邻的每3个词汇的向量相加,取平均值,放入输入层,输入层是表示输入词汇量序列,这些向量是通过Word2vec或者随机词向量产生;
S2、通过使用计算方法产生输出,计算方法为LSTM-RNN的计算方法,采用输出的最好一个向量作为分类的依据;
S3、通过将softmax层与RNN的输出进行全连接,获得情感极性的概率;
步骤五、将得到的概率值与真实值进行比较后,使用交叉熵函数作为损失函数,使用交叉熵函数作为损失函数时,通过BPTT更新参数,并且计算损值的大小,然后通过adam算法计算梯度,并用对模型进行参数调整;
步骤六、带模型进行收敛并导出模型,用于测试集的情感分类;
步骤七、找到每个词汇对应的词向量,放入输入层产生输出得到各个类别对应的概率值,并使用贪婪算法确定词汇的类别。
实施例2:
本发明提供一种技术方案:一种基于深度学习的用户情感分析方法,包括以下步骤;
步骤一、构建词汇表,将语料库的文本词语进行预训练,根据分析对象的性质构造特征向量获取模型,并且分别得到对应的TF-IDF和Word2vec特征词向量;
步骤二、使用分类器进行分类选中一部分作为种子词典,并且给出这些种子语料的情感极性得分词典,改进相应的TF-IDF特征选择过程,得到新的改进的TF-IDF特征选择词向量;
步骤三、分别将新改进得到的TF-IDF特征词向量与Word2vec特征词向量的结果保存起来;
步骤四、对于每种情感分类的情感种子词语进行加和求平均得到每种情感的中心词向量的极性的概率;
S1、对相邻的每4个词汇的向量相加,取平均值,放入输入层,输入层是表示输入词汇量序列,这些向量是通过Word2vec或者随机词向量产生;
S2、通过使用计算方法产生输出,计算方法为GRU-RNN的计算方法,采用输出的最好一个向量作为分类的依据;
S3、通过将softmax层与RNN的输出进行全连接,获得情感极性的概率;
步骤五、将得到的概率值与真实值进行比较后,使用交叉熵函数作为损失函数,使用交叉熵函数作为损失函数时,通过BPTT更新参数,并且计算损值的大小,然后通过adam算法计算梯度,并用对模型进行参数调整;
步骤六、带模型进行收敛并导出模型,用于测试集的情感分类;
步骤七、找到每个词汇对应的词向量,放入输入层产生输出得到各个类别对应的概率值,并使用贪婪算法确定词汇的类别。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (5)

1.一种基于深度学习的用户情感分析方法,其特征在于,包括以下步骤;
步骤一、构建词汇表,将语料库的文本词语进行预训练,根据分析对象的性质构造特征向量获取模型,并且分别得到对应的TF-IDF和Word2vec特征词向量;
步骤二、使用分类器进行分类选中一部分作为种子词典,并且给出这些种子语料的情感极性得分词典,改进相应的TF-IDF特征选择过程,得到新的改进的TF-IDF特征选择词向量;
步骤三、分别将新改进得到的TF-IDF特征词向量与Word2vec特征词向量的结果保存起来;
步骤四、对于每种情感分类的情感种子词语进行加和求平均得到每种情感的中心词向量的极性的概率;
S1、对相邻的每3-5个词汇的向量相加,取平均值,放入输入层;
S2、通过使用计算方法产生输出,采用输出的最好一个向量作为分类的依据;
S3、通过将softmax层与RNN的输出进行全连接,获得情感极性的概率;
步骤五、将得到的概率值与真实值进行比较后,使用交叉熵函数作为损失函数,并且计算损值的大小,然后通过adam算法计算梯度,并用对模型进行参数调整;
步骤六、带模型进行收敛并导出模型,用于测试集的情感分类;
步骤七、找到每个词汇对应的词向量,放入输入层产生输出得到各个类别对应的概率值,并使用贪婪算法确定词汇的类别。
2.根据权利要求1所述的一种基于深度学习的用户情感分析方法,其特征在于:步骤四中,计算方法为LSTM-RNN的计算方法。
3.根据权利要求1所述的一种基于深度学习的用户情感分析方法,其特征在于:步骤四中,计算方法为GRU-RNN的计算方法。
4.根据权利要求1所述的一种基于深度学习的用户情感分析方法,其特征在于:步骤四中,输入层是表示输入词汇量序列,这些向量是通过Word2vec或者随机词向量产生。
5.根据权利要求1所述的一种基于深度学习的用户情感分析方法,其特征在于:步骤五中,使用交叉熵函数作为损失函数时,通过BPTT更新参数。
CN201811565931.0A 2018-12-20 2018-12-20 一种基于深度学习的用户情感分析方法 Active CN109684636B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811565931.0A CN109684636B (zh) 2018-12-20 2018-12-20 一种基于深度学习的用户情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811565931.0A CN109684636B (zh) 2018-12-20 2018-12-20 一种基于深度学习的用户情感分析方法

Publications (2)

Publication Number Publication Date
CN109684636A true CN109684636A (zh) 2019-04-26
CN109684636B CN109684636B (zh) 2023-02-14

Family

ID=66188375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811565931.0A Active CN109684636B (zh) 2018-12-20 2018-12-20 一种基于深度学习的用户情感分析方法

Country Status (1)

Country Link
CN (1) CN109684636B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110134765A (zh) * 2019-05-05 2019-08-16 杭州师范大学 一种基于情感分析的餐厅用户评论分析系统及方法
CN110287924A (zh) * 2019-06-28 2019-09-27 电子科技大学 一种基于gru-rnn模型的土壤参数分类方法
CN111046171A (zh) * 2019-08-29 2020-04-21 成都信息工程大学 一种基于细粒度标注数据的情感判别方法
CN113222772A (zh) * 2021-04-08 2021-08-06 合肥工业大学 本土人格词典构建方法、系统、存储介质以及电子设备
CN114444504A (zh) * 2022-04-11 2022-05-06 西南交通大学 一种企业业务分类编码方法、装置、设备及可读存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101342A1 (zh) * 2015-12-15 2017-06-22 乐视控股(北京)有限公司 情感分类方法及装置
CN108427670A (zh) * 2018-04-08 2018-08-21 重庆邮电大学 一种基于语境词向量和深度学习的情感分析方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017101342A1 (zh) * 2015-12-15 2017-06-22 乐视控股(北京)有限公司 情感分类方法及装置
CN108427670A (zh) * 2018-04-08 2018-08-21 重庆邮电大学 一种基于语境词向量和深度学习的情感分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李寿山等: "基于双语信息和标签传播算法的中文情感词典构建方法", 《中文信息学报》 *
林江豪等: "基于词向量的领域情感词典构建", 《山东大学学报(工学版)》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110134765A (zh) * 2019-05-05 2019-08-16 杭州师范大学 一种基于情感分析的餐厅用户评论分析系统及方法
CN110287924A (zh) * 2019-06-28 2019-09-27 电子科技大学 一种基于gru-rnn模型的土壤参数分类方法
CN111046171A (zh) * 2019-08-29 2020-04-21 成都信息工程大学 一种基于细粒度标注数据的情感判别方法
CN113222772A (zh) * 2021-04-08 2021-08-06 合肥工业大学 本土人格词典构建方法、系统、存储介质以及电子设备
CN113222772B (zh) * 2021-04-08 2023-10-31 合肥工业大学 本土人格词典构建方法、系统、存储介质以及电子设备
CN114444504A (zh) * 2022-04-11 2022-05-06 西南交通大学 一种企业业务分类编码方法、装置、设备及可读存储介质
CN114444504B (zh) * 2022-04-11 2022-08-05 西南交通大学 一种企业业务分类编码方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN109684636B (zh) 2023-02-14

Similar Documents

Publication Publication Date Title
CN109684636A (zh) 一种基于深度学习的用户情感分析方法
Xie et al. Speech emotion classification using attention-based LSTM
Chen et al. Structure-aware abstractive conversation summarization via discourse and action graphs
CN105069072B (zh) 基于情感分析的混合用户评分信息推荐方法及其推荐装置
Chen et al. Speech emotion recognition: Features and classification models
CN108920622A (zh) 一种意图识别的训练方法、训练装置和识别装置
CN108710680A (zh) 一种利用深度学习进行基于情感分析的电影推荐方法
CN107480122A (zh) 一种人工智能交互方法及人工智能交互装置
CN110309839A (zh) 一种图像描述的方法及装置
CN108985464A (zh) 基于信息最大化生成对抗网络的人脸连续特征生成方法
CN107273349A (zh) 一种基于多种语言的实体关系抽取方法及服务器
Feng et al. Attribute inference attack of speech emotion recognition in federated learning settings
Xi et al. Domain adaptation with category attention network for deep sentiment analysis
Yang et al. Adaptive multi-view selection for semi-supervised emotion recognition of posts in online student community
CN106777040A (zh) 一种基于情感极性感知算法的跨媒体微博舆情分析方法
CN105488098A (zh) 一种基于领域差异性的新词提取方法
CN106886561A (zh) 基于时间关联交互融合的网络社区帖子影响排序方法
CN112966568A (zh) 一种视频客服服务质量分析方法及装置
Han et al. Robust human action recognition using global spatial-temporal attention for human skeleton data
CN108519976A (zh) 基于神经网络生成大规模情感词典的方法
Yadav et al. A comparative study of deep learning methods for hate speech and offensive language detection in textual data
Kumar et al. A reliable technique for sentiment analysis on tweets via machine learning and bert
CN110263232A (zh) 一种基于广度学习和深度学习的混合推荐方法
CN111353040A (zh) 基于gru的属性级别情感分析方法
Rasipuram et al. Multimodal depression detection using task-oriented transformer-based embedding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant