CN107578092A - 一种基于情绪和意见挖掘的情感复合分析方法及系统 - Google Patents

一种基于情绪和意见挖掘的情感复合分析方法及系统 Download PDF

Info

Publication number
CN107578092A
CN107578092A CN201710779613.3A CN201710779613A CN107578092A CN 107578092 A CN107578092 A CN 107578092A CN 201710779613 A CN201710779613 A CN 201710779613A CN 107578092 A CN107578092 A CN 107578092A
Authority
CN
China
Prior art keywords
opinion
mood
layer
emotion
emotional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710779613.3A
Other languages
English (en)
Inventor
胡建国
杨焕
王德明
丁颜玉
吴劲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Smart City Development Research Institute
Sun Yat Sen University
National Sun Yat Sen University
Original Assignee
Guangzhou Smart City Development Research Institute
National Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Smart City Development Research Institute, National Sun Yat Sen University filed Critical Guangzhou Smart City Development Research Institute
Priority to CN201710779613.3A priority Critical patent/CN107578092A/zh
Publication of CN107578092A publication Critical patent/CN107578092A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于情绪和意见挖掘的情感复合分析方法及系统,可以有效地达到一个情感分析的结果。该方法包括:对输入文本信息进行预处理;以词向量的形式将预处理后词汇输入设定的训练词向量层,同时将词向量进行拼接,获取词矩阵;采用二叉树算法与意见挖掘和情绪挖掘两个softmax层相结合对所述词矩阵分别进行意见和情绪挖掘,之后分别与语义语法向量进行重新组合,不断更新词向量中的情感信息,获取情绪训练集和意见训练集;采用卷积神经网路分别所述对情绪训练集和意见训练集进行处理,获取最终情感分析结果。通过本发明实施例,对文本进行预处理、训练、卷积神经网路,可以分析出文本信息包含用户的态度与想法。

Description

一种基于情绪和意见挖掘的情感复合分析方法及系统
技术领域
本发明涉及情感分析领域,尤其涉及一种基于情绪和意见挖掘的情感复合分析方法及系统。
背景技术
“情感分析”是“情感计算”中的一个重要领域,指的是在相当广泛领域的领域里面,检测、分析和评估出人类对不同事务,不同服务的情感,以及分析出其他可能的兴趣。更确切地来讲,“情感分析”是为了从人类日常的可以捕捉到的行为,包括书写、所听的音乐,甚至是表情,言语,动作等等,利用这些日常习惯来分析出他们的情绪,主张意见。通过不同的介质来分析情感是一个个可细化的具体研究领域,本发明是基于文本(包括词语,句子,文章)的情感挖掘方法。随着物联网的发展,各种各样的应用平台也在快速增加,为了使用户得到更好的服务体验,对于用户情感的分析显得格外重要。
基于文本的情感分析吸引了全世界各地的研究者,现主要有两种研究方法,一种是基于感情词典的情感分析方法,另一种是基于机器学习的情感分析方法。基于情感词典的分析方法需要相关领域的专家知识来建立相应的数据库进行匹配,浪费大量的人力,且效率较低。在机器学习逐渐发展的近几年,将机器学习应用到情感分析得到了一定的发展,但仍然是处于刚刚起步发展,仍有很多的缺点和不足。
发明内容
本发明的目的在于克服现有技术的不足,本发明提供了一种基于情绪和意见挖掘的情感复合分析方法及系统,可以分析出给定的文本信息中所包含的较为机械化的意见信息和所带的情感信息,更是将传统的情感分析方法提高了一个层次,成功分析出文本信息中所包含用户的态度与想法,对于各个应用平台有着极大的作用。与此同时,针对不同属性设计不同的处理层,使得本发明在整个系统的运行效率以及精确率上都比以往的情感分析系统有了很大的提高。
为了解决上述技术问题,本发明实施例一种基于情绪和意见挖掘的情感复合分析方法,所述方法包括:
对输入文本信息进行预处理,获取成功分词后的词汇;
以词向量的形式将所述成功分词后的词汇输入设定的训练词向量层,同时将词向量进行拼接,获取词矩阵;
采用二叉树算法与意见挖掘和情绪挖掘两个softmax层相结合对所述词矩阵分别进行意见和情绪挖掘,获取情绪向量组和意见向量组;
将所述情绪向量组和意见向量组分别与语义语法向量进行重新组合,不断更新词向量中的情感信息,获取情绪训练集和意见训练集;
采用卷积神经网路分别对情绪训练集和意见训练集进行处理,获取最终情感分析结果。
优选地,所述对输入文本信息进行预处理包括变量声明、定义全局变量的定义、构建词库、初始化网络结构,其中构建词库是从词的文本中构建词库。
优选地,所述设定的训练词向量层包括采用word2vec其中的CBOW(continuousbag-of-words model)作为基本训练模型。
优选地,所述意见挖掘和情绪挖掘两个softmax层分别对所述词矩阵进行意见和情绪挖掘包括:
对词矩阵意见挖掘步骤如下:
1)判断意见的主观性与客观性;
2)对于意见的极性进行分析(正向,反向,中立);
3)进行意见整合;
4)不断更新修改参数;
对词矩阵情绪挖掘步骤如下:
1)判断是否带有情绪;
2)对于情绪的极性进行分析;
3)进行情绪分类;
4)不断更新修改参数。
优选地,所述采用卷积神经网路对情绪训练集进行处理包括:
输入层:将情绪训练集进行输入,发送到卷积层;
卷积层:对输入层发送过来的情绪训练集进行卷积,提取情绪特征;
池化层:降低网络复杂度,进一步提取情绪重要特征并控制输出的统一性;
分类层:采用逻辑回归算法建立K个二元分类器来对情绪特征进行分类处理,获取情绪概率集。
优选地,所述对输入层发送过来的情绪训练集进行卷积包括对情绪训练集进行第一个卷积层特征提取后,利用LRN(Local Response Normalization)层进行特征挑选,然后再进行一个卷积层提取隐藏的情绪特征,获取情绪特征。
优选地,所述采用卷积神经网路对意见训练集进行处理包括:
输入层:将意见训练集进行输入,发送到卷积层;
卷积层:对输入层发送过来的意见训练集进行卷积,提取意见特征;
池化层:降低网络复杂度,进一步提取意见重要特征并控制输出的统一性;
分类层:采用逻辑回归算法建立K个二元分类器来对意见特征进行分类处理,获取意见概率集。
优选地,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述对输入层发送过来的意见训练集进行卷积包括对意见训练集进行第一个卷积层特征提取后使用一个LRN(Local Response Normalization)层进行意见特征挑选,获取意见特征。
优选地,所述卷积神经网路还包括全连接层,将情绪特征和意见特征进行连接,同时通过预先对所述意见概率集赋予权值R、情绪概率集赋予权值S,其中R+S=1,采用权值计算所述意见概率集和情绪概率集,获取最终情感分析结果。
另外,本发明实施例还提供了一种基于情绪和意见挖掘的情感复合分析系统,所述系统包括:
预处理模块:用于对输入文本信息进行预处理,获取成功分词后的词汇;
训练词向量层模块:用于将所述成功分词后的词汇以词向量的形式输入设定的训练词向量层,同时将词向量进行拼接,获取词矩阵;
意见和情绪挖掘模块:采用二叉树算法与意见挖掘和情绪挖掘两个softmax层相结合对所述词矩阵分别进行意见和情绪挖掘,获取情绪向量组和意见向量组;
向量重新组合模块:用于将所述情绪向量组和意见向量组分别与语义语法向量进行重新组合,不断更新词向量中的情感信息,获取情绪训练集和意见训练集;
卷积神经网路处理模块:用于将情绪训练集和意见训练集采用卷积神经网路分别进行处理,获取最终情感分析结果。
通过对文本信息进行预处理、训练和卷积神经网路,可以分析出给定的文本信息中所包含的较为机械化的意见信息和所带的情感信息,更是将传统的情感分析方法提高了一个层次,成功分析出文本信息中所包含用户的态度与想法,对于各个应用平台有着极大的作用。与此同时,针对不同属性设计不同的处理层,使得本发明在整个系统的运行效率以及精确率上都比以往的情感分析系统有了很大的提高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见的,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例一种基于情绪和意见挖掘的情感复合分析方法的详细流程示意图;
图2是图1的S15采用卷积神经网路分别对情绪训练集和意见训练集进行处理的详细流程示意图;
图3是本发明实施例一种基于情绪和意见挖掘的情感复合分析系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1是本发明实施例一种基于情绪和意见挖掘的情感复合分析方法结构示意图,如图1所示,所述方法包括:
S11:对输入文本信息进行预处理,获取成功分词后的词汇;
S12:以词向量的形式将所述成功分词后的词汇输入设定的训练词向量层,同时将词向量进行拼接,获取词矩阵;
S13:采用二叉树算法与意见挖掘和情绪挖掘两个softmax层相结合对所述词矩阵分别进行意见和情绪挖掘,获取情绪向量组和意见向量组;
S14:将所述情绪向量组和意见向量组分别与语义语法向量进行重新组合,不断更新词向量中的情感信息,获取情绪训练集和意见训练集;
S15:采用卷积神经网路分别对情绪训练集和意见训练集进行处理,获取最终情感分析结果。
对S11进一步说明:
输入文本信息进行预处理包括变量声明、定义全局变量的定义、构建词库、初始化网络结构,其中构建词库是从词的文本构建词库。
预处理过程如下:
1)在词库中增加“</S>”;
2)读取文本信息文件中的每一个词ReadWord();
3)根据条件是否指向最后一个词判断是否结束,如果是,按词频排序,否则查找词在词库中的位置;
4)根据3)获取词在词库中的位置判断该词是否存在,如果存在,将该词加入词频,如果不存在,在词库中增加该词;
5)对词库的低频词进行处理,转回2)操作。
由于涉及到的数据量庞大且属性较多,而且偶有缺失现象,利用决策树算法进行处理,能够有效地防止出现数据过度拟合的情况,分类出的属性更加的纯净。
对S12进一步说明:
在训练词向量层,采用word2vec其中的CBOW(continuous bag-of-words model)作为基本训练模型,所述CBOW模型以Huffman树作为基础,训练过程包括输入层(input),映射层(projection)和输出层(output),其中输入层为某个单词A周围的n-1个单词的词向量。输入层到映射层,只需将n-1个词向量进行相加即可。映射层到输出层需要借助构造的Huffman树,从根节点开始,映射层的值需要沿着Huffman树不断的进行logistic分类,并且不断的修正各中间向量和词向量。
对S13进一步说明:
将词矩阵运用二叉树算法进行处理,可以保证了语义语法信息分析的正确率。在此基础上,加入意见挖掘和情绪挖掘的两个softmax层。对于意见挖掘部分,主要进行判断意见的主观性与客观性,对于意见的极性进行分析(正向,反向,中立),根据不同的角度,不同的情绪色彩以及不同的极性对于意见进行整合,由于这是一个有监督的机器学习过程,在经过每次所给定的数据进行训练后不断更新修改参数。对于情绪挖掘部分,主要进行判断是否带有情绪,对于情绪的极性进行分析,进行情绪分类,不断更新修改参数。其中,在意见和情绪的极性分析上,针对不同类型的文本信息,主要分为以下三个等级:文章等级,语句等级,单词等级。对于单词等级:是整个意见挖掘特征提取的最基本的单位,可以针对某个特定的方面以及对于某种商品或者服务来进行操作;而对于语句等级的,整个情绪挖掘的基础就是要首先分析出每个句子的情绪极性,对于文章等级:情绪挖掘的最终目标既是对整篇文章所包含的情绪进行提取分析,而在分析句子情感的基础上,针对文章的不同结构(比如总-分-总)调整不同段落所占的权值进行整合,获取情绪挖掘的结果。最终分类出意见词向量组以及情绪词向量组。
对S15进一步说明:
采用卷积神经网路分别对情绪训练集和意见训练集进行处理的详细流程如图2所示。
图2是图1的S15采用卷积神经网路分别对情绪训练集和意见训练集进行处理详细流程示意图,如图2所示,所述方法包括:
S151输入层:将意见训练集进行输入,发送到卷积层;
S152卷积层:对输入层发送过来的意见训练集进行卷积,提取意见特征;
S153池化层:降低网络复杂度,进一步提取意见重要特征并控制输出的统一性;
S154分类层:采用逻辑回归算法建立K个二元分类器来对意见特征进行分类处理,获取意见概率集;
S155输入层:将情绪训练集进行输入,发送到卷积层;
S156卷积层:对输入层发送过来的情绪训练集进行卷积,提取情绪特征;
S157池化层:降低网络复杂度,进一步提取情绪重要特征并控制输出的统一性;
S158分类层:采用逻辑回归算法建立K个二元分类器来对情绪特征进行分类处理,获取情绪概率集;
S159全连接层:连接所有的情绪特征和意见特征,通过预先对所述意见概率集和情绪概率集赋予一定的权值,采用权值计算所述意见概率集和情绪概率集,获取最终情感分析结果。
对S152进一步说明:
针对意见词向量集,在一个卷积层后面加上了一个LRN(Local ResponseNormalization)层,可以从多个卷积核的响应中挑选比较大的反馈,抑制反馈较小的特征,从而使得最终的特征选取更加突出,更加具有代表性。
对S153和S157进一步说明:
S153的意见训练集处理的池化层和S157的情绪训练集处理的池化层都是进行一个降低网络复杂度的作用,池化操作可以减小数据量,从而减小参数,降低计算。池化操作在每个深度切片上进行,使用MAX操作,在每个深度切片的width和height方向下进行下采样,忽略掉75%(3/4)的激活信息,同时保持深度depth大小不变。
对S154和S158进一步说明:
由于无论是意见挖掘或是情绪挖掘,每个属性的子类别并不是互斥的关系,而是相互联系的,相对于传统的利用softmax分类器,采用建立K个二元分类器的算法,对于输入的每个新信息,逻辑回归算法能够更好地分别判断它们是否属于各个类别。经过二元分类器的分类后,分别生成了意见和情绪的分类概率集。
对S156进一步说明:
针对情绪词向量集,由于情绪特征较为隐晦,特征提取难度较大,因此采用两层卷积,在经过第一个卷积层进行特征提取后,利用LRN层进行特征挑选,再经过一个卷积层再次进行特征提取,把隐藏的特征进行最大限度的提取,保证了提取的特征的正确率。
图3是本发明实施例一种基于情绪和意见挖掘的情感复合分析系统结构示意图,如图3所示,所示系统包括:
11预处理模块:用于对输入文本信息进行预处理,获取成功分词后的词汇;
12训练词向量层模块:用于将所述成功分词后的词汇以词向量的形式输入设定的训练词向量层,同时将词向量进行拼接,获取词矩阵;
13意见和情绪挖掘模块:采用二叉树算法对所述词矩阵进行处理,加入意见挖掘和情绪挖掘两个softmax层对所述词矩阵分别进行意见和情绪挖掘,获取情绪向量组和意见向量组;
14向量重新组合模块:用于将所述情绪向量组和意见向量组分别与语义语法向量进行重新组合,不断更新词向量中的情感信息,获取情绪训练集和意见训练集;
15卷积神经网路处理模块:用于将情绪训练集和意见训练集采用卷积神经网路分别进行处理,获取最终情感分析结果。
对11预处理模块执行情况进一步说明:
预处理模块包括自定义声明变量、构建词库、初始化网络结构,其中构建词库是从词的文本构建词库。
预处理模块处理过程如下:
1)在词库中增加“</S>”;
2)读取文本信息文件中的每一个词ReadWord();
3)根据条件是否指向最后一个词判断是否结束,如果是,按词频排序,否则查找词在词库中的位置;
4)根据3)获取词在词库中的位置判断该词是否存在,如果存在,将该词加入词频,如果不存在,在词库中增加该词;
5)对词库的低频词进行处理,转回2)操作。
由于涉及到的数据量庞大且属性较多,而且偶有缺失现象,利用决策树算法进行处理,能够有效地防止出现数据过度拟合的情况,分类出的属性更加的纯净。
对13意见和情绪挖掘模块执行情况进一步说明:
在意见和情绪挖掘模块中,将词矩阵运用二叉树算法进行处理,可以保证了语义语法信息分析的正确率。在此基础上,加入意见挖掘和情绪挖掘的两个softmax层。对于意见挖掘部分,主要进行判断意见的主观性与客观性,对于意见的极性进行分析(正向,反向,中立),根据不同的角度,不同的情绪色彩以及不同的极性对于意见进行整合,由于这是一个有监督的机器学习过程,在经过每次所给定的数据进行训练后不断更新修改参数。对于情绪挖掘部分,主要进行判断是否带有情绪,对于情绪的极性进行分析,进行情绪分类,不断更新修改参数。其中,在意见和情绪的极性分析上,针对不同类型的文本信息,主要分为以下三个等级:文章等级,语句等级,单词等级。对于单词等级:是整个意见挖掘特征提取的最基本的单位,可以针对某个特定的方面以及对于某种商品或者服务来进行操作;而对于语句等级的,整个情绪挖掘的基础就是要首先分析出每个句子的情绪极性,对于文章等级:情绪挖掘的最终目标既是对整篇文章所包含的情绪进行提取分析,而在分析句子情感的基础上,针对文章的不同结构(比如总-分-总)调整不同段落所占的权值进行整合,获取情绪挖掘的结果。最终分类出意见词向量组以及情绪词向量组。
对15进一步说明:
卷积神经网路处理模块包括对情绪训练集和意见训练集处理,采用卷积神经网路对情绪训练集进行处理包括:将情绪训练集进行输入,发送到卷积层;对输入层发送过来的情绪训练集进行卷积,在一个卷积层后面加上了一个LRN(Local ResponseNormalization)层,可以从多个卷积核的响应中挑选比较大的反馈,抑制反馈较小的特征,从而使得最终的特征选取更加突出,更加具有代表性,最终获取情绪特征;降低网络复杂度,进一步提取情绪重要特征并控制输出的统一性;采用逻辑回归算法建立K个二元分类器来对情绪特征进行分类处理,获取情绪概率集。采用卷积神经网路对意见训练集进行处理包括:将意见训练集进行输入,发送到卷积层;对输入层发送过来的意见训练集进行卷积,由于情绪特征较为隐晦,特征提取难度较大,因此采用两层卷积,在经过第一个卷积层进行特征提取后,利用LRN层进行特征挑选,再经过一个卷积层再次进行特征提取,把隐藏的特征进行最大限度的提取,保证了提取的特征的正确率,最终获取意见特征;降低网络复杂度,进一步提取意见重要特征并控制输出的统一性;采用逻辑回归算法建立K个二元分类器来对意见特征进行分类处理,获取意见概率集。
连接所有的情绪特征和意见特征,通过预先对所述意见概率集和情绪概率集赋予一定的权值,采用权值计算所述意见概率集和情绪概率集,获取最终情感分析结果。
具体地,本发明实施例的系统相关功能模块的工作原理可参见方法实施例的相关描述,这里不再赘述。
通过对文本信息进行预处理、训练和卷积神经网路,可以分析出给定的文本信息中所包含的较为机械化的意见信息和所带的情感信息,更是将传统的情感分析方法提高了一个层次,成功分析出文本信息中所包含用户的态度与想法,对于各个应用平台有着极大的作用。与此同时,针对不同属性设计不同的处理层,使得本发明在整个系统的运行效率以及精确率上都比以往的情感分析系统有了很大的提高。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的一种基于情绪和意见挖掘的情感复合分析方法及系统进行了详细介绍,本文中应采用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述方法包括:
对输入文本信息进行预处理,获取成功分词后的词汇;
以词向量的形式将所述成功分词后的词汇输入设定的训练词向量层,同时将词向量进行拼接,获取词矩阵;
采用二叉树算法与意见挖掘和情绪挖掘两个softmax层相结合对所述词矩阵分别进行意见和情绪挖掘,获取情绪向量组和意见向量组;
将所述情绪向量组和意见向量组分别与语义语法向量进行重新组合,不断更新词向量中的情感信息,获取情绪训练集和意见训练集;
采用卷积神经网路分别对所述情绪训练集和意见训练集进行处理,获取最终情感分析结果。
2.根据权利要求1所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述对输入文本信息进行预处理包括变量声明、定义全局变量的定义、构建词库、初始化网络结构,其中构建词库是从词的文本中构建词库。
3.根据权利要求1所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述设定的训练词向量层包括采用word2vec其中的CBOW(continuous bag-of-wordsmodel)作为基本训练模型。
4.根据权利要求1所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述意见挖掘和情绪挖掘两个softmax层分别对所述词矩阵进行意见和情绪挖掘包括:
对词矩阵意见挖掘步骤如下:
1)判断意见的主观性与客观性;
2)对于意见的极性进行分析(正向,反向,中立);
3)进行意见整合;
4)不断更新修改参数;
对词矩阵情绪挖掘步骤如下:
1)判断是否带有情绪;
2)对于情绪的极性进行分析;
3)进行情绪分类;
4)不断更新修改参数。
5.根据权利要求1所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述采用卷积神经网路对情绪训练集进行处理包括:
输入层:将情绪训练集进行输入,发送到卷积层;
卷积层:对输入层发送过来的情绪训练集进行卷积,提取情绪特征;
池化层:降低网络复杂度,进一步提取情绪重要特征并控制输出的统一性;
分类层:采用逻辑回归算法建立K个二元分类器来对情绪特征进行分类处理,获取情绪概率集。
6.根据权利要求5所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述对输入层发送过来的情绪训练集进行卷积包括对情绪训练集进行第一个卷积层特征提取后,利用LRN(Local Response Normalization)层进行特征挑选,然后再进行一个卷积层提取隐藏的情绪特征,获取情绪特征。
7.根据权利要求1所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述采用卷积神经网路对意见训练集进行处理包括:
输入层:将意见训练集进行输入,发送到卷积层;
卷积层:对输入层发送过来的意见训练集进行卷积,提取意见特征;
池化层:降低网络复杂度,进一步提取意见重要特征并控制输出的统一性;
分类层:采用逻辑回归算法建立K个二元分类器来对意见特征进行分类处理,获取意见概率集。
8.根据权利要求7所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述对输入层发送过来的意见训练集进行卷积包括对意见训练集进行第一个卷积层特征提取后使用一个LRN(Local Response Normalization)层进行意见特征挑选,获取意见特征。
9.根据权利要求5-8所述,一种基于情绪和意见挖掘的情感复合分析方法,其特征在于,所述卷积神经网路还包括全连接层,将情绪特征和意见特征进行连接,同时通过预先对所述意见概率集赋予权值R、情绪概率集赋予权值S,其中R+S=1,采用权值计算所述意见概率集和情绪概率集,获取最终情感分析结果。
10.一种基于情绪和意见挖掘的情感复合分析系统,其特征在于,所述系统包括:
预处理模块:用于对输入文本信息进行预处理,获取成功分词后的词汇;
训练词向量层模块:用于将所述成功分词后的词汇以词向量的形式输入设定的训练词向量层,同时将词向量进行拼接,获取词矩阵;
意见和情绪挖掘模块:采用二叉树算法与意见挖掘和情绪挖掘两个softmax层相结合对所述词矩阵分别进行意见和情绪挖掘,获取情绪向量组和意见向量组;
向量重新组合模块:用于将所述情绪向量组和意见向量组分别与语义语法向量进行重新组合,不断更新词向量中的情感信息,获取情绪训练集和意见训练集;
卷积神经网路处理模块:用于将情绪训练集和意见训练集采用卷积神经网路分别进行处理,获取最终情感分析结果。
CN201710779613.3A 2017-09-01 2017-09-01 一种基于情绪和意见挖掘的情感复合分析方法及系统 Pending CN107578092A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710779613.3A CN107578092A (zh) 2017-09-01 2017-09-01 一种基于情绪和意见挖掘的情感复合分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710779613.3A CN107578092A (zh) 2017-09-01 2017-09-01 一种基于情绪和意见挖掘的情感复合分析方法及系统

Publications (1)

Publication Number Publication Date
CN107578092A true CN107578092A (zh) 2018-01-12

Family

ID=61030447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710779613.3A Pending CN107578092A (zh) 2017-09-01 2017-09-01 一种基于情绪和意见挖掘的情感复合分析方法及系统

Country Status (1)

Country Link
CN (1) CN107578092A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446221A (zh) * 2018-10-29 2019-03-08 北京百分点信息科技有限公司 一种基于语义分析的交互式数据探查方法
CN109446331A (zh) * 2018-12-07 2019-03-08 华中科技大学 一种文本情绪分类模型建立方法及文本情绪分类方法
CN109471930A (zh) * 2018-11-08 2019-03-15 浙江大学城市学院 一种面向用户情感的情绪板界面设计方法
CN109543039A (zh) * 2018-11-23 2019-03-29 中山大学 一种基于深度网络的自然语言情感分析方法
CN110309282A (zh) * 2019-06-14 2019-10-08 北京奇艺世纪科技有限公司 一种答案确定方法及装置
CN110969014A (zh) * 2019-11-18 2020-04-07 南开大学 一种基于同步神经网络的意见二元组抽取方法
CN111309910A (zh) * 2020-02-13 2020-06-19 南京云问网络技术有限公司 文本信息挖掘方法及装置
CN112307157A (zh) * 2019-07-29 2021-02-02 普天信息技术有限公司 申诉意见挖掘方法和装置
CN116069832A (zh) * 2023-04-07 2023-05-05 微网优联科技(成都)有限公司 数据挖掘方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899298A (zh) * 2015-06-09 2015-09-09 华东师范大学 一种基于大规模语料特征学习的微博情感分析方法
CN105740349A (zh) * 2016-01-25 2016-07-06 重庆邮电大学 一种结合Doc2vec和卷积神经网络的情感分类方法
US20170053646A1 (en) * 2015-08-17 2017-02-23 Mitsubishi Electric Research Laboratories, Inc. Method for using a Multi-Scale Recurrent Neural Network with Pretraining for Spoken Language Understanding Tasks
CN106874410A (zh) * 2017-01-22 2017-06-20 清华大学 基于卷积神经网络的中文微博文本情绪分类方法及其系统
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104899298A (zh) * 2015-06-09 2015-09-09 华东师范大学 一种基于大规模语料特征学习的微博情感分析方法
US20170053646A1 (en) * 2015-08-17 2017-02-23 Mitsubishi Electric Research Laboratories, Inc. Method for using a Multi-Scale Recurrent Neural Network with Pretraining for Spoken Language Understanding Tasks
CN105740349A (zh) * 2016-01-25 2016-07-06 重庆邮电大学 一种结合Doc2vec和卷积神经网络的情感分类方法
CN106874410A (zh) * 2017-01-22 2017-06-20 清华大学 基于卷积神经网络的中文微博文本情绪分类方法及其系统
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张志华: "《中国优秀硕士学位论文全文数据库 信息科技辑》", 15 October 2016 *
李纲等: "基于语义的情感挖掘系统的设计与实现", 《现代图书情报技术》 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109446221A (zh) * 2018-10-29 2019-03-08 北京百分点信息科技有限公司 一种基于语义分析的交互式数据探查方法
CN109471930B (zh) * 2018-11-08 2021-09-14 浙江大学城市学院 一种面向用户情感的情绪板界面设计方法
CN109471930A (zh) * 2018-11-08 2019-03-15 浙江大学城市学院 一种面向用户情感的情绪板界面设计方法
CN109543039B (zh) * 2018-11-23 2022-04-08 中山大学 一种基于深度网络的自然语言情感分析方法
CN109543039A (zh) * 2018-11-23 2019-03-29 中山大学 一种基于深度网络的自然语言情感分析方法
CN109446331A (zh) * 2018-12-07 2019-03-08 华中科技大学 一种文本情绪分类模型建立方法及文本情绪分类方法
CN110309282A (zh) * 2019-06-14 2019-10-08 北京奇艺世纪科技有限公司 一种答案确定方法及装置
CN112307157A (zh) * 2019-07-29 2021-02-02 普天信息技术有限公司 申诉意见挖掘方法和装置
CN110969014A (zh) * 2019-11-18 2020-04-07 南开大学 一种基于同步神经网络的意见二元组抽取方法
CN110969014B (zh) * 2019-11-18 2023-04-07 南开大学 一种基于同步神经网络的意见二元组抽取方法
CN111309910A (zh) * 2020-02-13 2020-06-19 南京云问网络技术有限公司 文本信息挖掘方法及装置
CN116069832A (zh) * 2023-04-07 2023-05-05 微网优联科技(成都)有限公司 数据挖掘方法、装置及电子设备
CN116069832B (zh) * 2023-04-07 2023-06-06 微网优联科技(成都)有限公司 数据挖掘方法、装置及电子设备

Similar Documents

Publication Publication Date Title
CN107578092A (zh) 一种基于情绪和意见挖掘的情感复合分析方法及系统
Bang et al. Explaining a black-box by using a deep variational information bottleneck approach
CN107590134A (zh) 文本情感分类方法、存储介质及计算机
CN109740154A (zh) 一种基于多任务学习的在线评论细粒度情感分析方法
CN107609009A (zh) 文本情感分析方法、装置、存储介质和计算机设备
CN108038205B (zh) 针对中文微博的观点分析原型系统
CN104462066B (zh) 语义角色标注方法及装置
CN109558487A (zh) 基于层次性多注意力网络的文档分类方法
CN107943847A (zh) 企业关系提取方法、装置及存储介质
CN110222140A (zh) 一种基于对抗学习和非对称哈希的跨模态检索方法
CN107301171A (zh) 一种基于情感词典学习的文本情感分析方法和系统
CN109299268A (zh) 一种基于双通道模型的文本情感分析方法
CN112199608B (zh) 基于网络信息传播图建模的社交媒体谣言检测方法
CN108763216A (zh) 一种基于中文数据集的文本情感分析方法
CN110516245A (zh) 细粒度情感分析方法、装置、计算机设备及存储介质
CN107978373A (zh) 一种基于共训练的半监督生物医学事件抽取方法
CN107330021A (zh) 基于多叉树的数据分类方法、装置及设备
CN106202010A (zh) 基于深度神经网络构建法律文本语法树的方法和装置
CN108154198A (zh) 知识库实体归一方法、系统、终端和计算机可读存储介质
CN112308115B (zh) 一种多标签图像深度学习分类方法及设备
CN106503723A (zh) 一种视频分类方法及装置
CN110263165A (zh) 一种基于半监督学习的用户评论情感分析方法
CN110502626A (zh) 一种基于卷积神经网络的方面级情感分析方法
CN108664512A (zh) 文本对象分类方法及装置
CN107223260A (zh) 用于动态地更新分类器复杂度的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180112

WD01 Invention patent application deemed withdrawn after publication