CN108108433A - 一种基于规则和数据网络融合的情感分析方法 - Google Patents
一种基于规则和数据网络融合的情感分析方法 Download PDFInfo
- Publication number
- CN108108433A CN108108433A CN201711371875.2A CN201711371875A CN108108433A CN 108108433 A CN108108433 A CN 108108433A CN 201711371875 A CN201711371875 A CN 201711371875A CN 108108433 A CN108108433 A CN 108108433A
- Authority
- CN
- China
- Prior art keywords
- word
- emotion
- msub
- sentiment
- mrow
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于规则和神经网络融合的情感分析方法。本发明步骤如下:步骤1、获取关于目标对象一定数量的结构化评论组成待分析的语料库,根据权威机构提供的情感本体库,结合语料库通过语义分析泛化得到情感本体库,情感本体库包含情感极限和情感程度;步骤2、对情感词匹配和情感词关系预处理,将语料库进行分词、文本分析、匹配本体库和评论句子中情感词,标注情感词的情感信息以及上下文对应的依存关系。其中,情感信息包含词的情感强度、情感极性和情感词词性;步骤3、情感计算、特征融合和情感倾向判断。本发明能更精确的根据上下文进行情感分类。
Description
技术领域
本发明属于自然语言处理领域,特别涉及中文文本情感分析方法,提供一种基于规则和神经网络融合的情感分析方法。
背景技术
随着互联网技术的快速发展,互联网上(包括门户网站、电子商务网站、社交网站、音/视频分享网站、论坛、博客、微博等)产生了海量的、由用户发表的对于诸如人物、事件、产品等目标实体的评论信息。与客观性文本不同的是,这些主观色彩浓厚的评论信息蕴含着大众舆论对上述目标实体的看法,对潜在用户、商家以及政府部门等具有十分重要的参考价值。然而,如果采用人工方式对这些海量信息进行收集和分析,显然是成本高昂、低效和困难的。利用计算机对非结构化的文本评论进行分类和提取的文本情感分析技术应运而生。
目前,国内外使用最多的文本情感分析方式有多种,机器学习的情感分析,基于语义规则的情感分析以及构建神经网络模型情感分析方法。其中有监督和半监督的机器学习和神经网络方法中分类起的训练需要一定数量经过标注的训练样本,然而人工标注过程相当耗时费力,成本昂贵,无监督学习则是无需标注的。基于语义规则的文本倾向性研究中,研究者一般考虑词语,句子,段落和篇章等多个角度自底向上进行层次分析。通过规则计算情感词汇情感值,得到句子、段落以及篇章的整体情感值,从而获得最终的情感倾向信息。
传统的基于机器学习和深度学习情感分类和神经网络浅层模型会出现上下文语义缺失,而本方法利用情感语义规则计算评论得出情感得分以及统计情感词数目构建规则模型的特征向量,然后将该特征向量作为新特征融入LSTM(Long Short-Term Memory)神经网络模型特征中。最终,从而能更精确根据上下文语义进行情感分类。
发明内容
本发明针对现有技术中均存在情感分析方法的不足,提供了一种基于规则和神经网络融合的情感分析方法,对中文文本进行更准确的判断。
本发明解决其技术问题所采用的技术方案具体包括以下步骤:
步骤1、获取关于目标对象一定数量的结构化评论组成待分析的语料库,根据权威机构提供的情感词典,结合语料库通过语义分析泛化得到情感词典,情感词典包含情感极限、情感程度以及修饰词词典,如图2所示;
步骤2、对情感词匹配和情感词关系预处理,将语料库进行分词、文本分析、匹配本体库和评论句子中情感词,标注情感词的情感信息以及上下文对应的依存关系。其中,情感信息包含词的情感强度、情感极性和情感词词性;
步骤3、情感计算和情感倾向判断;
根据评论中情感信息以及依存关系,结合系统规则进行情感值计算,得到情感得分。将情感得分和褒贬情感词数目作为新的特征采样,采用尾部嵌入到构建的特征向量中,建立LSTM模型进行情感训练和预测,得到最终情感倾向结果;
进一步地,根据步骤1所述情感本体库构建,具体步骤如下:
步骤1-1.使用网络机构中现有权威的情感本体库,去掉重复词之后作为原始本体库;
步骤1-2.从知网中下载同义词词林,将原始情感词典进行同义扩充;
步骤1-3.为了得到丰富的情感词典,引入word2vec工具,该工具能根据输入样本泛化推理得到和情感词语义相似的词。首先,情感分类评论进行去重和预处理噪点信息,之后对文本评论通过Jieba工具进行分词,得到构建情感词典的语料,利用连续词袋模型(CBOW)和负采样训练的算法进行训练。
连续词袋模型中,维度设置成50维,迭代次数为100词,之后得到词向量集合。在过程中,使用python版本word2vec中similar_by_word获取同义词林词典的近义词,通过余弦距离的绝对值进行衡量相似性(越接近1表示语义约相似)。例如计算词向量和词距离,公式如下:
SO_PMI定义了点互信息量的概念,用来计算两个词之间的语义相关性,两个词语原词w1和相似语义词w2的PMI公式为::
P(w1&w2)表示w1和w2共现的概率,P(w1)和P(w2)表示两个词各自出现的概率。通过计算,可以将两个词关系装换为三个状态:
关于点互信息(SO-PMI)的计算,选取经过同义词词典扩展的正面词和负面词作为基准词,用Pwords代表正面,Nwords代表负面两组词集合。这些词的情感倾向都非常明显,根据word2vec推理后的相似词w2分别与Pwords和Nwords互信息的差值赋予情感倾向。SO-PMI(w)公式为:
SO-PMI(w2)=ΣPword∈PwordsPMI(w2,Pword)-ΣNword∈NwordsPMI(w2,Nword) (4)
在一般情况下0作为SO-PMI的阈值,所以结果分为:
进一步的,步骤2所述的对情感词匹配和情感词关系预处理,本专利将原词w1和相似语义词w2相关且情感相同的词赋予相同的情感倾向和相同情感程度,并加入到情感词典中。
步骤2-1.利用分词工具和自定义用户词典进行分词,然后结合哈工大句法分析平台,将评论转换为tri-gram形式,组成语义依存关系队列。
步骤2-2.语义依存关系队列包含每个词的位置、词性标注以及前词后词的位置关系,能充分定位情感词的位置以及该情感词所修饰的名词;
2-2-1.通过匹配情感本体库,定位情感词的情感初始极性以及程度修饰权值。
2-2-2.得到情感词的位置信息,将情感词抽取出来构建情感词的特征列表。特征列表包含情感词的位置、情感极性和权值。
进一步地,根据步骤3情感计算和情感倾向判断,具体步骤如下:
步骤3-1.针对步骤2-1得到语义依存关系队列,构建本体库中匹配情感词信息,使用短语情感倾向评估法来近似计算评论的情感得分,得到褒贬情感词数。
步骤3-2.采用LSTM模型对文本情感极性评论进行最终分类。
对语料库中已标记过的评论进行训练,80%的评论作为训练集,20%的评论作为测试集。训练集的具体处理如下:
首先通过分词,删除停用词;
其次从步骤2-2中匹配情感词,并赋予情感词的权重;
然后将步骤3-1中的情感得分,褒贬词数形成的特征组合尾部嵌入到步骤1-3得到的句子向量空间集合,拼接步骤如下:
设第k个句子sk=(w0,w1,…,wi),其中wi为句子k中的第i个词。针对词语中wi本专利通过word2vec训练通过得到w1词的特征向量其中k表示向量维度。利用规则模型得到情感得分和情感信息向量Rk=(score,pcount,ncount),句子特征向量的组合规则模型得到的向量嵌入词向量得到,假设组合后的向量为xi=(γ0,γ1,…,γd),其中d为维度,特征融合公式如下:
其中,d,k满足以下关系d=k+3,然后根据神经网络模型架构流程图3建立标准LSTM模型,再进行分类得到最终评论情感倾向。
本发明有益效果如下:
文本特征粒度不局限于词间向量,同时包括句子级别。
情感分类融入了规则和情感词的维度,规则是基于句法语义,包括强度副词和倒置词,可以提高情感分析的精确度,而且规则的情感得分计算包含了更精确的情感信息。
融合的特征向量同样满足神经网络分类模型的对特征的需求,也能让模型在自我训练的时候学到更多的情感特征。
附图说明
图1为本发明情感分析方法的总体流程图。
图2为本发明构建情感本体库的对应流程。
图3为本发明神经网络模型架构流程图
具体实施方式
下面结合附图和实施例对本发明作进一步说。
如图1-3所示,一种基于规则和神经网络融合的情感分析方法,具体包括以下步骤:
步骤1、获取关于目标对象一定数量的结构化评论组成待分析的语料库,根据权威机构提供的情感词典,结合语料库通过语义分析泛化得到情感词典,情感词典包含情感极限、情感程度以及修饰词词典,如图2所示;
步骤2、对情感词匹配和情感词关系预处理,将语料库进行分词、文本分析、匹配本体库和评论句子中情感词,标注情感词的情感信息以及上下文对应的依存关系。其中,情感信息包含词的情感强度、情感极性和情感词词性;
步骤3、情感计算和情感倾向判断;
根据评论中情感信息以及依存关系,结合系统规则进行情感值计算,得到情感得分。将情感得分和褒贬情感词数目作为新的特征采样,采用尾部嵌入到构建的特征向量中,建立LSTM模型进行情感训练和预测,得到最终情感倾向结果;
进一步地,根据步骤1所述情感本体库构建,具体步骤如下:
步骤1-1.使用网络机构中现有权威的情感本体库,去掉重复词之后作为原始本体库;
步骤1-2.从知网中下载同义词词林,将原始情感词典进行同义扩充;
步骤1-3.为了得到丰富的情感词典,引入word2vec工具,该工具能根据输入样本泛化推理得到和情感词语义相似的词。首先,情感分类评论进行去重和预处理噪点信息,之后对文本评论通过Jieba工具进行分词,得到构建情感词典的语料,利用连续词袋模型(CBOW)和负采样训练的算法进行训练。
连续词袋模型中,维度设置成50维,迭代次数为100词,之后得到词向量集合。在过程中,使用python版本word2vec中similar_by_word获取同义词林词典的近义词,通过余弦距离的绝对值进行衡量相似性(越接近1表示语义约相似)。例如计算词向量和词距离,公式如下:
SO_PMI定义了点互信息量的概念,用来计算两个词之间的语义相关性,两个词语原词w1和相似语义词w2的PMI公式为::
P(w1&w2)表示w1和w2共现的概率,P(w1)和P(w2)表示两个词各自出现的概率。通过计算,可以将两个词关系装换为三个状态:
关于点互信息(SO-PMI)的计算,选取经过同义词词典扩展的正面词和负面词作为基准词,用Pwords代表正面,Nwords代表负面两组词集合。这些词的情感倾向都非常明显,根据word2vec推理后的相似词w2分别与Pwords和Nwords互信息的差值赋予情感倾向。SO-PMI(w)公式为:
SO-PMI(w2)=ΣPword∈PwordsPMI(w2,Pword)-ΣNword∈NwordsPMI(w2,Nword) (4)
在一般情况下0作为SO-PMI的阈值,所以结果分为:
进一步的,步骤2所述的对情感词匹配和情感词关系预处理,本专利将原词w1和相似语义词w2相关且情感相同的词赋予相同的情感倾向和相同情感程度,并加入到情感词典中。
步骤2-1.利用分词工具和自定义用户词典进行分词,然后结合哈工大句法分析平台,将评论转换为tri-gram形式,组成语义依存关系队列。
步骤2-2.语义依存关系队列包含每个词的位置、词性标注以及前词后词的位置关系,能充分定位情感词的位置以及该情感词所修饰的名词;
2-2-1.通过匹配情感本体库,定位情感词的情感初始极性以及程度修饰权值。
2-2-2.得到情感词的位置信息,将情感词抽取出来构建情感词的特征列表。特征列表包含情感词的位置、情感极性和权值。
进一步地,根据步骤3情感计算和情感倾向判断,具体步骤如下:
步骤3-1.针对步骤2-1得到语义依存关系队列,构建本体库中匹配情感词信息,使用短语情感倾向评估法来近似计算评论的情感得分,得到褒贬情感词数。
步骤3-2.采用LSTM模型对文本情感极性评论进行最终分类。
对语料库中已标记过的评论进行训练,80%的评论作为训练集,20%的评论作为测试集。训练集的具体处理如下:
首先通过分词,删除停用词;
其次从步骤2-2中匹配情感词,并赋予情感词的权重;
然后将步骤3-1中的情感得分,褒贬词数形成的特征组合尾部嵌入到步骤1-3得到的句子向量空间集合,拼接步骤如下:
设第k个句子sk=(w0,w1,…,wi),其中wi为句子k中的第i个词。针对词语中wi本专利通过word2vec训练通过得到w1词的特征向量其中k表示向量维度。利用规则模型得到情感得分和情感信息向量Rk=(srore,pcount,ncount),句子特征向量的组合规则模型得到的向量嵌入词向量得到,假设组合后的向量为xi=(γ0,γ1,…,γd),其中d为维度,特征融合公式如下:
其中,d,k满足以下关系d=k+3,然后根据神经网络模型架构流程图3建立标准LSTM模型,再进行分类得到最终评论情感倾向。
Claims (6)
1.一种基于规则和神经网络融合的情感分析方法,其特征在于包括以下步骤:
步骤1、获取关于目标对象一定数量的结构化评论组成待分析的语料库,根据权威机构提供的情感词典,结合语料库通过语义分析泛化得到情感词典,情感词典包含情感极限、情感程度以及修饰词词典;
步骤2、对情感词匹配和情感词关系预处理,将语料库进行分词、文本分析、匹配本体库和评论句子中情感词,标注情感词的情感信息以及上下文对应的依存关系;
步骤3、情感计算和情感倾向判断;
根据评论中情感信息以及依存关系,结合系统规则进行情感值计算,得到情感得分;将情感得分和褒贬情感词数目作为新的特征采样,采用尾部嵌入到构建的特征向量中,建立LSTM模型进行情感训练和预测,得到最终情感倾向结果。
2.根据权利要求1所述的一种基于规则和神经网络融合的情感分析方法,其特征在于步骤2所述的情感信息包含词的情感强度、情感极性和情感词词性。
3.根据权利要求2所述的一种基于规则和神经网络融合的情感分析方法,其特征在于步骤1所述情感本体库构建,具体步骤如下:
步骤1-1.使用网络机构中现有权威的情感本体库,去掉重复词之后作为原始本体库;
步骤1-2.从知网中下载同义词词林,将原始情感词典进行同义扩充;
步骤1-3.为了得到丰富的情感词典,引入word2vec工具,该工具能根据输入样本泛化推理得到和情感词语义相似的词;首先,情感分类评论进行去重和预处理噪点信息,之后对文本评论通过Jieba工具进行分词,得到构建情感词典的语料,利用连续词袋模型和负采样训练的算法进行训练;
连续词袋模型中,维度设置成50维,迭代次数为100词,之后得到词向量集合;在过程中,使用python版本word2vec中similar_by_word获取同义词林词典的近义词,通过余弦距离的绝对值进行衡量相似性;计算词向量和词距离,公式如下:
<mrow>
<mi>v</mi>
<mi>e</mi>
<mi>c</mi>
<mo>_</mo>
<mi>d</mi>
<mi>i</mi>
<mi>s</mi>
<mi>tan</mi>
<mi>c</mi>
<mi>e</mi>
<mrow>
<mo>(</mo>
<msub>
<mi>v</mi>
<mn>1</mn>
</msub>
<mo>,</mo>
<msub>
<mi>v</mi>
<mn>2</mn>
</msub>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>|</mo>
<mfrac>
<mrow>
<msub>
<mi>v</mi>
<mn>1</mn>
</msub>
<mo>&CenterDot;</mo>
<msub>
<mi>v</mi>
<mn>2</mn>
</msub>
</mrow>
<mrow>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>v</mi>
<mn>1</mn>
</msub>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<mo>|</mo>
<msub>
<mi>v</mi>
<mn>2</mn>
</msub>
<mo>|</mo>
<mo>|</mo>
</mrow>
</mfrac>
<mo>|</mo>
<mo>=</mo>
<mo>|</mo>
<mfrac>
<mrow>
<msub>
<mi>x</mi>
<mn>1</mn>
</msub>
<msub>
<mi>y</mi>
<mn>1</mn>
</msub>
<mo>+</mo>
<msub>
<mi>x</mi>
<mn>2</mn>
</msub>
<msub>
<mi>y</mi>
<mn>2</mn>
</msub>
<mo>+</mo>
<mn>...</mn>
<mo>+</mo>
<msub>
<mi>x</mi>
<mi>n</mi>
</msub>
<msub>
<mi>y</mi>
<mi>n</mi>
</msub>
</mrow>
<mrow>
<msqrt>
<mrow>
<msup>
<msub>
<mi>x</mi>
<mn>1</mn>
</msub>
<mn>2</mn>
</msup>
<mo>+</mo>
<msup>
<msub>
<mi>x</mi>
<mn>2</mn>
</msub>
<mn>2</mn>
</msup>
<mo>+</mo>
<mn>...</mn>
<mo>+</mo>
<msup>
<msub>
<mi>x</mi>
<mi>n</mi>
</msub>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
<msqrt>
<mrow>
<msup>
<msub>
<mi>y</mi>
<mn>1</mn>
</msub>
<mn>2</mn>
</msup>
<mo>+</mo>
<msup>
<msub>
<mi>y</mi>
<mn>2</mn>
</msub>
<mn>2</mn>
</msup>
<mo>+</mo>
<mn>...</mn>
<mo>+</mo>
<msup>
<msub>
<mi>y</mi>
<mi>n</mi>
</msub>
<mn>2</mn>
</msup>
</mrow>
</msqrt>
</mrow>
</mfrac>
<mo>|</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
SO_PMI定义了点互信息量的概念,用来计算两个词之间的语义相关性,两个词语原词w1和相似语义词w2的PMI公式为::
P(w1&w2)表示w1和w2共现的概率,P(w1)和P(w2)表示两个词各自出现的概率;通过计算,能够将两个词关系装换为三个状态:
关于点互信息的计算,选取经过同义词词典扩展的正面词和负面词作为基准词,用Pwords代表正面,Nwords代表负面两组词集合;这些词的情感倾向都非常明显,根据word2vec推理后的相似词w2分别与Pwords和Nwords互信息的差值赋予情感倾向;SO-PMI(w)公式为:
SO-PMI(w2)=∑Pword∈PwordsPMI(w2,Pword)-∑Nword∈NwordsPMI(w2,Nword) (4)
在一般情况下0作为SO-PMI的阈值,所以结果分为:
将原词w1和相似语义词w2相关且情感相同的词赋予相同的情感倾向和相同情感程度,并加入到情感词典中。
4.根据权利要求3所述的一种基于规则和神经网络融合的情感分析方法,其特征在于步骤2所述的对情感词匹配和情感词关系预处理,具体如下:
步骤2-1.利用分词工具和自定义用户词典进行分词,然后结合哈工大句法分析平台,将评论转换为tri-gram形式,组成语义依存关系队列;
步骤2-2.语义依存关系队列包含每个词的位置、词性标注以及前词后词的位置关系,能充分定位情感词的位置以及该情感词所修饰的名词;
2-2-1.通过匹配情感本体库,定位情感词的情感初始极性以及程度修饰权值;
2-2-2.得到情感词的位置信息,将情感词抽取出来构建情感词的特征列表;特征列表包含情感词的位置、情感极性和权值。
5.根据权利要求4所述的一种基于规则和神经网络融合的情感分析方法,其特征在于步骤3所述的情感计算和情感倾向判断,具体步骤如下:
步骤3-1.针对步骤2-1得到语义依存关系队列,构建本体库中匹配情感词信息,使用短语情感倾向评估法来近似计算评论的情感得分,得到褒贬情感词数;
步骤3-2.采用LSTM模型对文本情感极性评论进行最终分类;
对语料库中已标记过的评论进行训练,80%的评论作为训练集,20%的评论作为测试集。
6.根据权利要求5所述的一种基于规则和神经网络融合的情感分析方法,其特征在于训练集的具体处理如下:
首先通过分词,删除停用词;
其次从步骤2-2中匹配情感词,并赋予情感词的权重;
然后将步骤3-1中的情感得分,褒贬词数形成的特征组合尾部嵌入到步骤1-3得到的句子向量空间集合,拼接步骤如下:
设第k个句子sk=(w0,w1,…,wi),其中wi为句子k中的第i个词;针对词语中wi本专利通过word2vec训练通过得到w1词的特征向量Vi w=(v0,v1,…,vk),其中k表示向量维度;利用规则模型得到情感得分和情感信息向量Rk=(score,pcount,ncount),句子特征向量的组合规则模型得到的向量嵌入词向量得到,假设组合后的向量为xi=(γ0,γ1,…,γd),其中d为维度,特征融合公式如下:
xi=(γ0,γ1,…,γd)
=[Vi w;Rk]
=(v0,v1,…,vk,score,pcount,ncount) (5)
其中,d,k满足以下关系d=k+3,然后根据神经网络模型架构流程建立标准LSTM模型,再进行分类得到最终评论情感倾向。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711371875.2A CN108108433A (zh) | 2017-12-19 | 2017-12-19 | 一种基于规则和数据网络融合的情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711371875.2A CN108108433A (zh) | 2017-12-19 | 2017-12-19 | 一种基于规则和数据网络融合的情感分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108108433A true CN108108433A (zh) | 2018-06-01 |
Family
ID=62210089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711371875.2A Pending CN108108433A (zh) | 2017-12-19 | 2017-12-19 | 一种基于规则和数据网络融合的情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108108433A (zh) |
Cited By (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033433A (zh) * | 2018-08-13 | 2018-12-18 | 中国地质大学(武汉) | 一种基于卷积神经网络的评论数据情感分类方法及系统 |
CN109101490A (zh) * | 2018-07-24 | 2018-12-28 | 山西大学 | 一种基于融合特征表示的事实型隐式情感识别方法和系统 |
CN109145302A (zh) * | 2018-08-30 | 2019-01-04 | 南京都宁大数据科技有限公司 | 基于语义文本的大宗农产品投资者恐慌情绪测度方法 |
CN109213861A (zh) * | 2018-08-01 | 2019-01-15 | 上海电力学院 | 结合At_GRU神经网络与情感词典的旅游评价情感分类方法 |
CN109255027A (zh) * | 2018-08-27 | 2019-01-22 | 上海宝尊电子商务有限公司 | 一种电商评论情感分析降噪的方法和装置 |
CN109284499A (zh) * | 2018-08-01 | 2019-01-29 | 数据地平线(广州)科技有限公司 | 一种行业文本情感获取方法、装置及存储介质 |
CN109308487A (zh) * | 2018-08-06 | 2019-02-05 | 同济大学 | 一种基于弹幕数据分析的广告投放机制 |
CN109376956A (zh) * | 2018-11-29 | 2019-02-22 | 西安电子科技大学 | 社交网络中公共危机信息的预测方法 |
CN109670167A (zh) * | 2018-10-24 | 2019-04-23 | 国网浙江省电力有限公司 | 一种基于Word2Vec的电力客服工单情感量化分析方法 |
CN109670039A (zh) * | 2018-11-20 | 2019-04-23 | 华南师范大学 | 基于三部图和聚类分析的半监督电商评论情感分析方法 |
CN109684647A (zh) * | 2019-02-19 | 2019-04-26 | 东北林业大学 | 电影评论情感分析方法及装置 |
CN109726745A (zh) * | 2018-12-19 | 2019-05-07 | 北京理工大学 | 一种融入描述知识的基于目标的情感分类方法 |
CN109885687A (zh) * | 2018-12-29 | 2019-06-14 | 深兰科技(上海)有限公司 | 一种文本的情感分析方法、装置、电子设备及存储介质 |
CN109902300A (zh) * | 2018-12-29 | 2019-06-18 | 深兰科技(上海)有限公司 | 一种创建词典的方法、装置、电子设备及存储介质 |
CN110020437A (zh) * | 2019-04-11 | 2019-07-16 | 江南大学 | 一种视频和弹幕相结合的情感分析及可视化方法 |
CN110321563A (zh) * | 2019-06-28 | 2019-10-11 | 浙江大学 | 基于混合监督模型的文本情感分析方法 |
CN110727758A (zh) * | 2018-06-28 | 2020-01-24 | 中国科学院声学研究所 | 一种基于多长度文本向量拼接的舆情分析方法及其系统 |
CN110825876A (zh) * | 2019-11-07 | 2020-02-21 | 上海德拓信息技术股份有限公司 | 电影评论观点情感倾向性分析方法 |
CN111324734A (zh) * | 2020-02-17 | 2020-06-23 | 昆明理工大学 | 融合情绪知识的案件微博评论情绪分类方法 |
CN111538835A (zh) * | 2020-03-30 | 2020-08-14 | 东南大学 | 一种基于知识图谱的社交媒体情感分类方法与装置 |
CN111694960A (zh) * | 2020-06-03 | 2020-09-22 | 哈尔滨商业大学 | 基于词性特征和观点特征结合卷积神经网络的电商评论情感分析模型 |
CN111815426A (zh) * | 2020-09-11 | 2020-10-23 | 深圳司南数据服务有限公司 | 一种涉及金融投研的数据处理方法及终端 |
CN111914556A (zh) * | 2020-06-19 | 2020-11-10 | 合肥工业大学 | 基于情感语义转移图谱的情感引导方法及系统 |
CN112214661A (zh) * | 2020-10-12 | 2021-01-12 | 西华大学 | 一种面向视频常规评论的情感不稳定用户检测方法 |
CN112307179A (zh) * | 2020-10-21 | 2021-02-02 | 深圳技术大学 | 文本匹配方法、装置、设备及存储介质 |
CN112489688A (zh) * | 2020-11-09 | 2021-03-12 | 浪潮通用软件有限公司 | 一种基于神经网络的情感识别方法、设备及介质 |
CN112613612A (zh) * | 2020-12-29 | 2021-04-06 | 合肥工业大学 | 一种基于专利库的绿色设计知识库的构建方法及其装置 |
CN113032554A (zh) * | 2019-12-24 | 2021-06-25 | Tcl集团股份有限公司 | 一种决策系统和计算机可读存储介质 |
CN113112310A (zh) * | 2021-05-12 | 2021-07-13 | 北京大学 | 一种商品服务文化附加值评估方法、装置和系统 |
CN113158669A (zh) * | 2021-04-28 | 2021-07-23 | 河北冀联人力资源服务集团有限公司 | 一种用工平台正负面评论识别的方法及系统 |
CN113298365A (zh) * | 2021-05-12 | 2021-08-24 | 北京信息科技大学 | 一种基于lstm的文化附加值评估方法 |
CN113298366A (zh) * | 2021-05-12 | 2021-08-24 | 北京信息科技大学 | 一种旅游演艺服务价值评估方法 |
CN113343706A (zh) * | 2021-05-27 | 2021-09-03 | 山东师范大学 | 基于多模态特征和语义规则的文本抑郁倾向检测系统 |
CN113420151A (zh) * | 2021-07-13 | 2021-09-21 | 上海明略人工智能(集团)有限公司 | 一种情感极性强度分类方法、系统、电子设备及介质 |
CN114416917A (zh) * | 2021-12-09 | 2022-04-29 | 国网安徽省电力有限公司 | 一种基于词典的电力领域文本情感分析方法、系统和存储介质 |
US11954443B1 (en) | 2021-06-03 | 2024-04-09 | Wells Fargo Bank, N.A. | Complaint prioritization using deep learning model |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105005553A (zh) * | 2015-06-19 | 2015-10-28 | 四川大学 | 基于情感词典的短文本情感倾向分析方法 |
CN105809186A (zh) * | 2016-02-25 | 2016-07-27 | 中国科学院声学研究所 | 情感分类的方法及系统 |
CN106503049A (zh) * | 2016-09-22 | 2017-03-15 | 南京理工大学 | 一种基于svm融合多种情感资源的微博情感分类方法 |
CN106776581A (zh) * | 2017-02-21 | 2017-05-31 | 浙江工商大学 | 基于深度学习的主观性文本情感分析方法 |
CN107066445A (zh) * | 2017-04-11 | 2017-08-18 | 华东师范大学 | 一种属性情感词向量的深度学习方法 |
CN107193801A (zh) * | 2017-05-21 | 2017-09-22 | 北京工业大学 | 一种基于深度信念网络的短文本特征优化及情感分析方法 |
CN107291696A (zh) * | 2017-06-28 | 2017-10-24 | 达而观信息科技(上海)有限公司 | 一种基于深度学习的评论词情感分析方法及系统 |
CN107305539A (zh) * | 2016-04-18 | 2017-10-31 | 南京理工大学 | 一种基于Word2Vec网络情感新词发现的文本倾向性分析方法 |
-
2017
- 2017-12-19 CN CN201711371875.2A patent/CN108108433A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105005553A (zh) * | 2015-06-19 | 2015-10-28 | 四川大学 | 基于情感词典的短文本情感倾向分析方法 |
CN105809186A (zh) * | 2016-02-25 | 2016-07-27 | 中国科学院声学研究所 | 情感分类的方法及系统 |
CN107305539A (zh) * | 2016-04-18 | 2017-10-31 | 南京理工大学 | 一种基于Word2Vec网络情感新词发现的文本倾向性分析方法 |
CN106503049A (zh) * | 2016-09-22 | 2017-03-15 | 南京理工大学 | 一种基于svm融合多种情感资源的微博情感分类方法 |
CN106776581A (zh) * | 2017-02-21 | 2017-05-31 | 浙江工商大学 | 基于深度学习的主观性文本情感分析方法 |
CN107066445A (zh) * | 2017-04-11 | 2017-08-18 | 华东师范大学 | 一种属性情感词向量的深度学习方法 |
CN107193801A (zh) * | 2017-05-21 | 2017-09-22 | 北京工业大学 | 一种基于深度信念网络的短文本特征优化及情感分析方法 |
CN107291696A (zh) * | 2017-06-28 | 2017-10-24 | 达而观信息科技(上海)有限公司 | 一种基于深度学习的评论词情感分析方法及系统 |
Non-Patent Citations (5)
Title |
---|
姜杰等: "机器学习与语义规则融合的微博情感分类方法", 《北京大学学报(自然科学版)》 * |
杜振雷: "面向微博短文本的情感分析研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
沈磊: "基于规则与机器学习方法的中文微博情感分析研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
邹梦宇: "基于多方法融合的中文微博情感倾向性分析研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
陈雷: "面向股票评论的情感分析系统研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110727758B (zh) * | 2018-06-28 | 2023-07-18 | 郑州芯兰德网络科技有限公司 | 一种基于多长度文本向量拼接的舆情分析方法及其系统 |
CN110727758A (zh) * | 2018-06-28 | 2020-01-24 | 中国科学院声学研究所 | 一种基于多长度文本向量拼接的舆情分析方法及其系统 |
CN109101490B (zh) * | 2018-07-24 | 2021-04-27 | 山西大学 | 一种基于融合特征表示的事实型隐式情感识别方法和系统 |
CN109101490A (zh) * | 2018-07-24 | 2018-12-28 | 山西大学 | 一种基于融合特征表示的事实型隐式情感识别方法和系统 |
CN109213861A (zh) * | 2018-08-01 | 2019-01-15 | 上海电力学院 | 结合At_GRU神经网络与情感词典的旅游评价情感分类方法 |
CN109284499A (zh) * | 2018-08-01 | 2019-01-29 | 数据地平线(广州)科技有限公司 | 一种行业文本情感获取方法、装置及存储介质 |
CN109213861B (zh) * | 2018-08-01 | 2022-03-29 | 上海电力学院 | 结合At_GRU神经网络与情感词典的旅游评价情感分类方法 |
CN109308487A (zh) * | 2018-08-06 | 2019-02-05 | 同济大学 | 一种基于弹幕数据分析的广告投放机制 |
CN109308487B (zh) * | 2018-08-06 | 2021-03-30 | 同济大学 | 一种基于弹幕数据分析的广告投放方法 |
CN109033433A (zh) * | 2018-08-13 | 2018-12-18 | 中国地质大学(武汉) | 一种基于卷积神经网络的评论数据情感分类方法及系统 |
CN109033433B (zh) * | 2018-08-13 | 2020-09-29 | 中国地质大学(武汉) | 一种基于卷积神经网络的评论数据情感分类方法及系统 |
CN109255027B (zh) * | 2018-08-27 | 2022-06-24 | 上海宝尊电子商务有限公司 | 一种电商评论情感分析降噪的方法和装置 |
CN109255027A (zh) * | 2018-08-27 | 2019-01-22 | 上海宝尊电子商务有限公司 | 一种电商评论情感分析降噪的方法和装置 |
CN109145302A (zh) * | 2018-08-30 | 2019-01-04 | 南京都宁大数据科技有限公司 | 基于语义文本的大宗农产品投资者恐慌情绪测度方法 |
CN109670167A (zh) * | 2018-10-24 | 2019-04-23 | 国网浙江省电力有限公司 | 一种基于Word2Vec的电力客服工单情感量化分析方法 |
CN109670167B (zh) * | 2018-10-24 | 2023-07-25 | 国网浙江省电力有限公司 | 基于相似度词序矩阵的电力客服工单情感量化分析方法 |
CN109670039A (zh) * | 2018-11-20 | 2019-04-23 | 华南师范大学 | 基于三部图和聚类分析的半监督电商评论情感分析方法 |
CN109376956A (zh) * | 2018-11-29 | 2019-02-22 | 西安电子科技大学 | 社交网络中公共危机信息的预测方法 |
CN109726745A (zh) * | 2018-12-19 | 2019-05-07 | 北京理工大学 | 一种融入描述知识的基于目标的情感分类方法 |
CN109726745B (zh) * | 2018-12-19 | 2020-10-09 | 北京理工大学 | 一种融入描述知识的基于目标的情感分类方法 |
CN109902300A (zh) * | 2018-12-29 | 2019-06-18 | 深兰科技(上海)有限公司 | 一种创建词典的方法、装置、电子设备及存储介质 |
CN109885687A (zh) * | 2018-12-29 | 2019-06-14 | 深兰科技(上海)有限公司 | 一种文本的情感分析方法、装置、电子设备及存储介质 |
CN109684647A (zh) * | 2019-02-19 | 2019-04-26 | 东北林业大学 | 电影评论情感分析方法及装置 |
CN109684647B (zh) * | 2019-02-19 | 2020-07-24 | 东北林业大学 | 电影评论情感分析方法及装置 |
CN110020437B (zh) * | 2019-04-11 | 2023-04-07 | 江南大学 | 一种视频和弹幕相结合的情感分析及可视化方法 |
CN110020437A (zh) * | 2019-04-11 | 2019-07-16 | 江南大学 | 一种视频和弹幕相结合的情感分析及可视化方法 |
CN110321563A (zh) * | 2019-06-28 | 2019-10-11 | 浙江大学 | 基于混合监督模型的文本情感分析方法 |
CN110825876A (zh) * | 2019-11-07 | 2020-02-21 | 上海德拓信息技术股份有限公司 | 电影评论观点情感倾向性分析方法 |
CN113032554A (zh) * | 2019-12-24 | 2021-06-25 | Tcl集团股份有限公司 | 一种决策系统和计算机可读存储介质 |
CN111324734A (zh) * | 2020-02-17 | 2020-06-23 | 昆明理工大学 | 融合情绪知识的案件微博评论情绪分类方法 |
CN111538835A (zh) * | 2020-03-30 | 2020-08-14 | 东南大学 | 一种基于知识图谱的社交媒体情感分类方法与装置 |
CN111538835B (zh) * | 2020-03-30 | 2023-05-23 | 东南大学 | 一种基于知识图谱的社交媒体情感分类方法与装置 |
CN111694960A (zh) * | 2020-06-03 | 2020-09-22 | 哈尔滨商业大学 | 基于词性特征和观点特征结合卷积神经网络的电商评论情感分析模型 |
CN111914556A (zh) * | 2020-06-19 | 2020-11-10 | 合肥工业大学 | 基于情感语义转移图谱的情感引导方法及系统 |
CN111914556B (zh) * | 2020-06-19 | 2023-10-31 | 合肥工业大学 | 基于情感语义转移图谱的情感引导方法及系统 |
CN111815426B (zh) * | 2020-09-11 | 2020-12-15 | 深圳司南数据服务有限公司 | 一种涉及金融投研的数据处理方法及终端 |
CN111815426A (zh) * | 2020-09-11 | 2020-10-23 | 深圳司南数据服务有限公司 | 一种涉及金融投研的数据处理方法及终端 |
CN112214661A (zh) * | 2020-10-12 | 2021-01-12 | 西华大学 | 一种面向视频常规评论的情感不稳定用户检测方法 |
CN112307179A (zh) * | 2020-10-21 | 2021-02-02 | 深圳技术大学 | 文本匹配方法、装置、设备及存储介质 |
CN112489688A (zh) * | 2020-11-09 | 2021-03-12 | 浪潮通用软件有限公司 | 一种基于神经网络的情感识别方法、设备及介质 |
CN112613612B (zh) * | 2020-12-29 | 2022-08-02 | 合肥工业大学 | 一种基于专利库的绿色设计知识库的构建方法及其装置 |
CN112613612A (zh) * | 2020-12-29 | 2021-04-06 | 合肥工业大学 | 一种基于专利库的绿色设计知识库的构建方法及其装置 |
CN113158669A (zh) * | 2021-04-28 | 2021-07-23 | 河北冀联人力资源服务集团有限公司 | 一种用工平台正负面评论识别的方法及系统 |
CN113112310A (zh) * | 2021-05-12 | 2021-07-13 | 北京大学 | 一种商品服务文化附加值评估方法、装置和系统 |
CN113298365A (zh) * | 2021-05-12 | 2021-08-24 | 北京信息科技大学 | 一种基于lstm的文化附加值评估方法 |
CN113298366A (zh) * | 2021-05-12 | 2021-08-24 | 北京信息科技大学 | 一种旅游演艺服务价值评估方法 |
CN113298365B (zh) * | 2021-05-12 | 2023-12-01 | 北京信息科技大学 | 一种基于lstm的文化附加值评估方法 |
CN113298366B (zh) * | 2021-05-12 | 2023-12-12 | 北京信息科技大学 | 一种旅游演艺服务价值评估方法 |
CN113343706A (zh) * | 2021-05-27 | 2021-09-03 | 山东师范大学 | 基于多模态特征和语义规则的文本抑郁倾向检测系统 |
CN113343706B (zh) * | 2021-05-27 | 2023-10-31 | 山东师范大学 | 基于多模态特征和语义规则的文本抑郁倾向检测系统 |
US11954443B1 (en) | 2021-06-03 | 2024-04-09 | Wells Fargo Bank, N.A. | Complaint prioritization using deep learning model |
CN113420151A (zh) * | 2021-07-13 | 2021-09-21 | 上海明略人工智能(集团)有限公司 | 一种情感极性强度分类方法、系统、电子设备及介质 |
CN114416917A (zh) * | 2021-12-09 | 2022-04-29 | 国网安徽省电力有限公司 | 一种基于词典的电力领域文本情感分析方法、系统和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108108433A (zh) | 一种基于规则和数据网络融合的情感分析方法 | |
CN107609132A (zh) | 一种基于语义本体库中文文本情感分析方法 | |
CN107133224B (zh) | 一种基于主题词的语言生成方法 | |
CN105912625B (zh) | 一种面向链接数据的实体分类方法和系统 | |
CN107862087B (zh) | 基于大数据和深度学习的情感分析方法、装置和存储介质 | |
CN112668319B (zh) | 基于中文信息和越南语句法指导的越南语新闻事件检测方法 | |
Chang et al. | Research on detection methods based on Doc2vec abnormal comments | |
CN108563638B (zh) | 一种基于主题识别和集成学习的微博情感分析方法 | |
CN103678278A (zh) | 一种中文文本情感识别方法 | |
CN110704621A (zh) | 文本处理方法、装置及存储介质和电子设备 | |
Zad et al. | A survey of deep learning methods on semantic similarity and sentence modeling | |
CN112015862B (zh) | 基于层级多通道注意力的用户异常评论检测方法及系统 | |
CN110502626A (zh) | 一种基于卷积神经网络的方面级情感分析方法 | |
CN112989802B (zh) | 一种弹幕关键词提取方法、装置、设备及介质 | |
CN110427616A (zh) | 一种基于深度学习的文本情感分析方法 | |
CN115357719B (zh) | 基于改进bert模型的电力审计文本分类方法及装置 | |
Bao et al. | Will_Go at SemEval-2020 Task 3: An accurate model for predicting the (graded) effect of context in word similarity based on BERT | |
CN110765769A (zh) | 一种基于子句特征的实体属性依赖情感分析方法 | |
CN110134934A (zh) | 文本情感分析方法和装置 | |
CN108073571A (zh) | 一种多语言文本质量评估方法及系统、智能文本处理系统 | |
CN114818717A (zh) | 融合词汇和句法信息的中文命名实体识别方法及系统 | |
CN107451116B (zh) | 一种移动应用内生大数据统计分析方法 | |
Wadud et al. | Text coherence analysis based on misspelling oblivious word embeddings and deep neural network | |
CN112818698A (zh) | 一种基于双通道模型的细粒度的用户评论情感分析方法 | |
CN107291686B (zh) | 情感标识的辨识方法和情感标识的辨识系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180601 |