CN106776581B - 基于深度学习的主观性文本情感分析方法 - Google Patents

基于深度学习的主观性文本情感分析方法 Download PDF

Info

Publication number
CN106776581B
CN106776581B CN201710093687.1A CN201710093687A CN106776581B CN 106776581 B CN106776581 B CN 106776581B CN 201710093687 A CN201710093687 A CN 201710093687A CN 106776581 B CN106776581 B CN 106776581B
Authority
CN
China
Prior art keywords
emotion
sentence
model
word
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710093687.1A
Other languages
English (en)
Other versions
CN106776581A (zh
Inventor
施寒潇
厉小军
陈南南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Gongshang University
Original Assignee
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Gongshang University filed Critical Zhejiang Gongshang University
Priority to CN201710093687.1A priority Critical patent/CN106776581B/zh
Publication of CN106776581A publication Critical patent/CN106776581A/zh
Application granted granted Critical
Publication of CN106776581B publication Critical patent/CN106776581B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于深度学习的主观性文本情感分析方法,包括:(1)在C&W模型的基础上,构建C&W‑SP模型,将句子的情感标签与词性标签标注于句子内,构建C&W_SPC&W‑SP模型的训练集,并利用该训练集对C&W_SP模型进行训练,得到训练集中每个词的词向量,组成词向量文件;(2)根据获得的词向量文件,利用LSTM模型构建句子向量集;(3)利用句子向量集对神经网络模型进行训练,得到情感分类模型;(4)对测试评论语句进行预处理,测试句子向量将测试句子向量输入到情感分类模型中,计算得到此段评论的情感倾向。该方法情感倾向信息、词性信息加入词语中,提高了情感分析的准确度。

Description

基于深度学习的主观性文本情感分析方法
技术领域
本发明属于计算机应用技术领域,具体涉及的是一种基于深度学习的主观性文本情感分析方法。
背景技术
随着互联网的飞速发展,特别是Web2.0技术的逐渐普及,广大网络用户已经从过去单纯的信息获取者变为网络内容的主要制造者。中国互联网络信息中心发布的《第38次中国互联网络发展状况统计报告》(CNNIC,2016)的数据显示,截至2016年6月,我国网络用户总数量已经达到7.10亿,半年共计新增网民2132万人,半年增长率为3.1%,互联网普及率为51.7%。如此庞大且快速增长的网络用户群体加上Web2.0模式的互联网应用,使网络内容的数量和网络信息的访问量都以前所未有的速度增长,互联网已经成为人们表达观点、获取信息的重要途径。当前互联网上的信息形式多种多样,如新闻、博客文章、产品评论、论坛帖子等等。
近几年,社会网络(social network)应用的推进和用户创造内容(UGC)模式的兴起,普通网民越来越成为信息内容的重要生产者。以金融信息评论为例,互联网上作为金融信息中UGC重要形式之一的用户评论,既表达了用户对证券市场的个体观点,又涵盖了用户与股票、用户与用户之间的关系,兼具内容与关联的特征,成为情感分析研究的一个新热点。目前,带有情绪信息的金融评论在互联网上呈爆炸式增长,这些情绪信息对普通投资者、公司机构和国家政府等各级别的用户都有重要意义,如何有效的将带有情绪信息的金融评论转化成有助于各类用户应用的有价值资源,已成为当前需要迫切解决的问题之一。对于主观性文本的情感分析研究正是适应这种需求,希望架设一座用户到情绪信息的桥梁,使用户能有效获取情绪信息。从实践角度而言,利用这些情绪信息一方面可以帮助金融、证券监管部门及时了解投资者的情绪变化,特别是股灾或者疯牛这样极端行情下的情绪反馈,为后续的政策引导提供线索依据;另一方面可以给出不同类别投资者的情绪指数变化曲线,同时也可与其他主要证券行情分析指数联合构建出合理的投资模型,这在一定程度上为投资者提供更全面的投资决策支持。
目前情感分析方法大致有两类。第一种是基于规则的方法。主要先根据情感词典找出文本中出现的情感词,然后进行简单的情感极性统计,根据最终得分与事先设定阈值比较得出情感极性结论,一般用于篇章级别的情感分析。第二种是基于机器学习的方法。通过对大量标注语料的训练,生成情感分类器,用来对测试文本进行分类。
(1)基于规则的方法。目前的方法主要是设计规则提取情感词和极性判定,然后对所有的情感词进行简单情感极性统计求得文本的整体情感极性,该方法更多的应用于篇章的情感分析。另外,通过计算词语的语义倾向,综合考虑极性元素分布、密度和语义强度进行情感词的扩展,进一步修正文本的整体情感极性。
(2)基于机器学习的方法。这种方法主要使用情感词、词语共现对、句法模板、主题相关特征等作为分类特征,使用基于机器学习的分类方法进行情感/倾向性分析。常用的分类方法有:中心向量分类法、KNN分类法、感知器分类法、贝叶斯分类法、最大熵分类法和支持向量机分类法等。一般过程是首先通过对训练文档进行手工标注,生产训练模型,然后进行测试文档的预测。该方法目前在句子级别的情感分析中有广泛的应用。
其中使用基于规则的方法进行文本情感分析时,无论是对句子还是篇章进行分析,都强烈依赖于情感词典,且情感词典构建的好坏直接影响到最终情感分析的准确性。而构建情感词典分为两种,一种是手工构建,其工作量巨大,并且随着互联网的发展,新的情感词层出不穷、日益更新,使得整个构建工作十分困难;另一种是通过自动的方式构建情感词典,但是略过了手工之后,自动构建的情感词典的一个主要问题是准确度较低。
基于机器学习的方法来进行情感分析研究,已经成为研究的热点。目前存在的一些运用词向量的机器学习方法,大多只考虑到了语法结构,而一个主观性文本中,不仅存在着语法结构,同时还会有情感、词性等其他的关系。
发明内容
鉴于上述,本发明提出了一种基于深度学习的主观性文本情感分析方法,该方法可以对电子商务网站或股票金融网站等网站的相关评论进行情感倾向性分析,进而为企业或政府等相关部门提供舆情分析结果或预警。
一种基于深度学习的主观性文本情感分析方法,包括以下步骤:
(1)在C&W模型的基础上,构建基于情感信息和词性信息的C&W词向量(C&W BasedSentiment and Part-of-speech Word Embedding,C&W-SP)模型,将句子的情感标签与词性标签标注于句子内,构建C&W-SP模型的训练集,并利用该训练集对C&W-SP模型进行训练,得到训练集中每个词的词向量,组成词向量文件;
(2)根据获得的词向量文件,利用长短时间记忆(Long Short Term,LSTM)网络构建句子向量集;
(3)利用句子向量集对神经网络模型进行训练,得到情感分类模型;
(4)对测试评论语句进行分词处理、情感标签与词性标签标注处理,并根据步骤(1)获得的词向量文件获得该测试评论的词向量输入矩阵;然后通过步骤(2)的方法将该测试词向量转化为测试句子向量,将测试句子向量输入到情感分类模型中,计算得到此段评论的情感倾向。
所述的步骤(1)的具体步骤为:
(1-1)添加获取句子的情感信息的情感抽取模块和获取句子中每个词的词性信息的词性标注模块于C&W模型上,得到C&W-SP模型;
(1-2)对数据集以句子为单位进行中文分词操作,得到由m个句子组成的分词数据集;
(1-3)将分词数据集中的每个句子的情感标签和每个句子中的每个词语的词性标签标注于该句子内,作为C&W-SP模型训练集;
(1-4)将C&W-SP模型训练集输入到C&W-SP模型中,以C&W-SP模型损失函数最小化为目标,采用随机梯度下降和反向传播算法更新模型参数,得到该训练集中每个词对应的词向量,组成词向量文件。
步骤(1-2)中,所述的中文分词操作主要是基于字符串匹配原理来实现的。现有的开源的中中文分词层出不穷,且准确率将近100%,主要有中科院汉语分词系统(ICTCLAS)、结巴分词(jieba)等。
步骤(1-3)的具体步骤为:
(1-3-1)利用情感词典方式或情感识别工具识别句子情感信息,并将该句子的情感标签添加于句子的末端,以一个空格与整个句子隔开;
(1-3-2)利用词性标注工具或分词工具自带的词性标注模块将句子中的每个词的词性标签添加于每个词的后端以下划线隔开;
(1-3-3)利用词性标注工具或分词工具自带的词性标注模块将句子的情感标签的词性标签添加于该情感标签的后端以下划线隔开。
步骤(1-3-1)中,所述的情感标签为
Figure BDA0001229704840000052
其中,
Figure BDA0001229704840000053
表示积极情感,
Figure BDA0001229704840000054
表示消极情感。
步骤(1-3-2)和(1-3-3)中,所述的词性标注工具为斯坦福语法分析器(Stanfordparser)。
步骤(1-4)中,所述的C&W-SP模型分为输入层(Lookup)、线性隐藏层(linear)、非线性隐藏层(hTanh)以及线性输出层(linear)。训练过程为:将训练集作为输入,通过滑动窗口的方式将窗口内每个词的n-gram以及情感性信息和词性信息输入到模型进行训练,通过线性隐藏层和非线性隐藏层,输出一个二维标量[fcw,f1 u],其中,fcw代表词性-语义分数,f1 u代表情感分数。
步骤(1-4)中,所述的C&W-SP模型的损失函数为:
lossC&W-SP(t,tr)=α·losscw(t,tr)+(1-α)·lossus(t,tr)
其中,α为权重,losscw(t,tr)为C&W模型的损失函数,具体为:
losscw(t,tr)=max(0,1-fcw(t)+fcw(tr))
lossus(t,tr)为情感损失函数,具体为:
lossus(t,tr)=max(0,1-δs(t)f1 u(t)+δs(t)f1 u(tr))
δs(t)为反映句子情感倾向性的指示函数,其具体计算公式为:
Figure BDA0001229704840000055
给定训练语料库中的任一句子t,t=(wi-(n-1)/2,...,wi-1,wi,wi+1,...,wi+(n-1)/2),通过使用词典中的其他词w′i将句子中心位置的单词wi随机替换,被替换句子记为tr,fcw(t)为t的词性-语义分数,fcw(tr)为tr的词性-语义分数。f1 u(t)为t的情感分数,f1 u(tr)为tr的情感分数,g=gold polarity,即标准情感倾向,[1,0]表示积极,[0,1]表示消极。
通过步骤(1)得到的词向量是一个用特定维度来表示词语的向量,且向量中的每个元素不是0或1。例如:教师的词向量为[0.729,0.142,……0.523],且每个词向量中含有词语的语义信息、词性信息以及情感倾向信息。
所述的步骤(2)的具体步骤为:
(2-1)采用步骤(1-1)和步骤(1-2)的方法对数据集中的n个句子进行分词处理、情感标签与词性标签标注处理,得到预处理数据集;
(2-2)根据步骤(1)中获得的词向量文件,提取预处理数据集中每个句子的每个词的词向量,构建句子矩阵集;
(2-3)以句子为单位,将句子矩阵中的每个词对应的词向量按照顺序输入至LSTM网络,经训练得到句子向量集。
所述的步骤(3)的具体步骤为:
(3-1)采用降维采样的方式对步骤(2)中获得的句子向量集进行情感语义特征提取,得到将情感语义特征集;
(3-2)将情感语义特征集作为神经网络模型的输入,将句子的情感语义特征对应的标准情感类标组成的集合作为神经网络模型的真值输出,通过反向传播算法和随机梯度下降算法更新神经网络模型的参数,得到情感分类模型。
本发明的基于深度学习的主观性文本情感分析方法将情感倾向信息、词性信息加入词语中,使得词向量所具有的属性增加,提高了词表示的准确率;采用LSTM网络生成句子向量的方法,更加切合句子本身的结构,提高了句子向量表示的准确度;使用基于深度学习的主观性文本情感分析方法,提高了情感分析的准确度。
附图说明
图1是本发明实施例基于深度学习的主观性文本情感分析方法的流程图;
图2是本发明实施例构建的C&W-SP模型的结构图;
图3是本发明实施例采用的LSTM模型的结构图。
具体实施方式
为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
图1所示的是本实施例基于深度学习的主观性文本情感分析方法的流程图,具体过程为:
S01,添加获取句子的情感信息的情感抽取模块和获取句子中每个词的词性信息的词性标注模块于C&W模型上,得到C&W-SP模型。
S02,将句子的情感标签与词性标签标注于句子内,构建C&W-SP模型的训练集,并利用该训练集对C&W-SP模型进行训练,得到训练集中每个词的词向量,组成词向量文件,记为vector.txt文件。
S02的具体步骤为:
S02-1,对数据集以句子为单位进行中文分词操作,得到由m个句子组成的分词数据集。
中文分词操作主要是基于字符串匹配原理来实现的。现有的开源的中中文分词层出不穷,且准确率将近100%,主要有中科院汉语分词系统(ICTCLAS)、结巴分词(jieba)等。此步骤中采用中科院汉语分词系统进行分词操作。
S02-2,将分词数据集中的每个句子的情感标签和每个句子中的每个词语的词性标签标注于该句子内,作为C&W-SP模型训练集。
此步骤的具体做法为:
首先,利用情感词典方式识别句子情感信息,并将该句子的情感标签
Figure BDA0001229704840000081
Figure BDA0001229704840000082
添加于句子的末端,以一个空格与整个句子隔开;
然后,利用斯坦福语法分析器将句子中的每个词的词性标签添加于每个词的后端以下划线隔开;
最后,利用斯坦福语法分析器将句子的情感标签的词性标签添加于该情感标签的后端以下划线隔开。
以“这个是我买过最好的包包!”为例详细阐述S02-2的过程:
首先,对原句子“这个是我买过最好的包包!”进行分词,得到分词后的句子为:
“这个 是 我 买 过 最好 的 包包!”
然后,对分词后的句子进行情感信息标注,得到情感标签标注后的句子为:
“这个 是 我 买 过 最好 的 包包!
最后,对情感标签标注后的句子进行词性信息标注,得到词性标签标注后的句子为:
“这个_r是_v我_r买_v过_ug最好_a的_uj包包_v!_x
Figure BDA0001229704840000084
_emo”
S02-3,将C&W-SP模型训练集输入到C&W-SP模型中,以C&W-SP模型损失函数最小化为目标,采用随机梯度下降和反向传播算法更新模型参数,得到该训练集中每个词对应的词向量,组成词向量文件,记为vector.txt文件。
如图2所示,此步骤中的C&W-SP模型分为输入层(Lookup)、线性隐藏层(linear)、非线性隐藏层(hTanh)以及线性输出层(linear)。训练过程为:将训练集作为输入,通过滑动窗口的方式将窗口内每个词的n-gram以及情感性信息和词性信息输入到模型进行训练,通过线性隐藏层和非线性隐藏层,输出一个二维标量[fcw,f1 u],其中,fcw代表词性-语义分数,f1 u代表情感分数。
C&W-SP模型的损失函数为:
lossC&W-SP(t,tr)=α·losscw(t,tr)+(1-α)·lossus(t,tr)
其中,α为权重,losscw(t,tr)为C&W模型的损失函数,具体为:
losscw(t,tr)=max(0,1-fcw(t)+fcw(tr))
lossus(t,tr)为情感损失函数,具体为:
lossus(t,tr)=max(0,1-δs(t)f1 u(t)+δs(t)f1 u(tr))
δs(t)为反映句子情感倾向性的指示函数,其具体计算公式为:
Figure BDA0001229704840000091
该步骤C&W-SP模型训练的目标是以lossC&W-SP(t,tr)最小,实际含义是原始句子的语言模型分数
Figure BDA0001229704840000092
比被替换句子的语言模型分数
Figure BDA0001229704840000093
至少高1,且原始句子的情感分数f1 u(t)和被替换句子的情感分数f1 u(tr)相一致。
以预处理后的“这个_r是_v我_r买_v过_ug最好_a的_uj包包_v!_x
Figure BDA0001229704840000094
_emo”为例,经过模型训练,获得每个词对应的词向量,即:
这个_r:[0.2586,-0.5268,0.48952,……]
最好_a:[-0.8563,0.4781,0.17521,……]
S03,根据获得的词向量文件,利用LSTM模型构建句子向量集。
S03的具体步骤为:
S03-1,采用S02-1和S02-2的方法对数据集中的n个句子进行分词处理、情感标签与词性标签标注处理,得到预处理数据集;
S03-2,根据S02中获得的词向量文件,提取预处理数据集中每个句子的每个词的词向量,构建句子矩阵集;
S03-3,以句子为单位,将句子矩阵集中的每个词对应的词向量按照顺序输入至如图3所示的LSTM网络,经训练得到句子向量集。
LSTM网络中特殊的记忆单元(Memory Cell)的引入可以很好的保留历史信息,同时门结构的引入,包括输入门(Input Gate),输出门(Output Gate)和遗忘门(ForgetGate)可以很好的解决长期依赖等问题。
S04,利用句子向量集对神经网络模型进行训练,得到情感分类模型;
S04,的具体步骤为:
S04-1,采用降维采样的方式对S03中获得的句子向量进行情感语义特征提取,得到将情感语义特征集;
S04-2,将情感语义特征集作为神经网络模型的输入,将句子的情感语义特征对应的标准情感类标组成的集合作为神经网络模型的真值输出,通过反向传播算法和随机梯度下降算法更新神经网络模型的参数,得到情感分类模型。
此步骤中,调用Softmax等激活函数,实现句子的情感分类,0代表消极,1代表积极。
S05,对测试评论语句进行分词处理、情感标签与词性标签标注处理,并根据S01获得的词向量文件获得该测试评论的词向量;然后通过S02的方法将该测试词向量转化为测试句子向量,将测试句子向量输入到情感分类模型中,计算得到此段评论的情感倾向。
以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明,应理解的是以上所述仅为本发明的最优选实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充和等同替换等,均应包含在本发明的保护范围之内。

Claims (6)

1.一种基于深度学习的主观性文本情感分析方法,包括以下步骤:
(1)在C&W模型的基础上,构建C&W-SP模型,将句子的情感标签与词性标签标注于句子内,构建C&W-SP模型的训练集,并利用该训练集对C&W-SP模型进行训练,得到训练集中每个词的词向量,组成词向量文件,具体包括:
(1-1)添加获取句子的情感信息的情感抽取模块和获取句子中每个词的词性信息的词性标注模块于C&W模型上,得到C&W-SP模型;
(1-2)对数据集以句子为单位进行中文分词操作,得到由m个句子组成的分词数据集;
(1-3)将分词数据集中的每个句子的情感标签和每个句子中的每个词语的词性标签标注于该句子内,作为C&W-SP模型训练集;
(1-4)将C&W-SP模型训练集输入到C&W-SP模型中,以C&W-SP模型损失函数最小化为目标,采用随机梯度下降和反向传播算法更新模型参数,得到该训练集中每个词对应的词向量,组成词向量文件;
(2)根据获得的词向量文件,利用LSTM网络构建句子向量集;
(3)利用句子向量集对神经网络模型进行训练,得到情感分类模型;
(4)对测试评论语句进行分词处理、情感标签与词性标签标注处理,并根据步骤(1)获得的词向量文件获得该测试评论的词向量输入矩阵;然后通过步骤(2)的方法将测试词向量转化为测试句子向量,将测试句子向量输入到情感分类模型中,计算得到此段评论的情感倾向。
2.根据权利要求1所述的基于深度学习的主观性文本情感分析方法,其特征在于:所述的步骤(1-3)的具体步骤为:
(1-3-1)利用情感词典方式或情感识别工具识别句子情感信息,并将该句子的情感标签添加于句子的末端,以一个空格与整个句子隔开;
(1-3-2)利用词性标注工具或分词工具自带的词性标注模块将句子中的每个词的词性标签添加于每个词的后端以下划线隔开;
(1-3-3)利用词性标注工具或分词工具自带的词性标注模块将句子的情感标签的词性标签添加于该情感标签的后端以下划线隔开。
3.根据权利要求1所述的基于深度学习的主观性文本情感分析方法,其特征在于:所述的C&W-SP模型分为输入层、线性隐藏层、非线性隐藏层以及线性输出层;训练过程为:将训练集作为输入,通过滑动窗口的方式将窗口内每个词的n-gram以及情感性信息和词性信息输入到模型进行训练,通过线性隐藏层和非线性隐藏层,输出一个二维标量[fcw,f1 u],其中,fcw代表词性-语义分数,f1 u代表情感分数。
4.根据权利要求1所述的基于深度学习的主观性文本情感分析方法,其特征在于:所述的C&W-SP模型的损失函数为:
lossC&W-SP(t,tr)=α·losscw(t,tr)+(1-α)·lossus(t,tr)
其中,α为权重,losscw(t,tr)为C&W模型的损失函数,具体为:
losscw(t,tr)=max(0,1-fcw(t)+fcw(tr))
lossus(t,tr)为情感损失函数,具体为:
lossus(t,tr)=max(0,1-δs(t)f1 u(t)+δs(t)f1 u(tr))
δs(t)为反映句子情感倾向性的指示函数,其具体计算公式为:
其中,fcw(t)为句子t的语言模型分数,fcw(tr)代表替换句子tr的语言模型分数,f1 u(t)代表句子t的情感分数,f1 u(tr)为替换句子tr的情感分数,g=gold polarity,为标准情感倾向,[1,0]表示积极,[0,1]表示消极。
5.根据权利要求1所述的基于深度学习的主观性文本情感分析方法,其特征在于:所述的步骤(2)的具体步骤为:
(2-1)采用步骤(1-1)和步骤(1-2)的方法对数据集中的n个句子进行分词处理、情感标签与词性标签标注处理,得到预处理数据集;
(2-2)根据步骤(1)中获得的词向量文件,提取预处理数据集中每个句子的每个词的词向量,构建句子矩阵集;
(2-3)以句子为单位,将句子矩阵中的每个词对应的词向量按照顺序输入至LSTM网络,经训练得到句子向量集。
6.根据权利要求1所述的基于深度学习的主观性文本情感分析方法,其特征在于:所述的步骤(3)的具体步骤为:
(3-1)采用降维采样的方式对步骤(2)中获得的句子向量集进行情感语义特征提取,得到将情感语义特征集;
(3-2)将情感语义特征集作为神经网络模型的输入,将句子的情感语义特征对应的标准情感类标组成的集合作为神经网络模型的真值输出,通过反向传播算法和随机梯度下降算法更新神经网络模型的参数,得到情感分类模型。
CN201710093687.1A 2017-02-21 2017-02-21 基于深度学习的主观性文本情感分析方法 Active CN106776581B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710093687.1A CN106776581B (zh) 2017-02-21 2017-02-21 基于深度学习的主观性文本情感分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710093687.1A CN106776581B (zh) 2017-02-21 2017-02-21 基于深度学习的主观性文本情感分析方法

Publications (2)

Publication Number Publication Date
CN106776581A CN106776581A (zh) 2017-05-31
CN106776581B true CN106776581B (zh) 2020-01-24

Family

ID=58957505

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710093687.1A Active CN106776581B (zh) 2017-02-21 2017-02-21 基于深度学习的主观性文本情感分析方法

Country Status (1)

Country Link
CN (1) CN106776581B (zh)

Families Citing this family (117)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
CN107291696A (zh) * 2017-06-28 2017-10-24 达而观信息科技(上海)有限公司 一种基于深度学习的评论词情感分析方法及系统
CN107544957A (zh) * 2017-07-05 2018-01-05 华北电力大学 一种面向商品目标词的情感倾向分析方法
CN107832305A (zh) 2017-11-28 2018-03-23 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN107944014A (zh) * 2017-12-11 2018-04-20 河海大学 一种基于深度学习的中文文本情感分析方法
CN108108433A (zh) * 2017-12-19 2018-06-01 杭州电子科技大学 一种基于规则和数据网络融合的情感分析方法
CN108170681A (zh) * 2018-01-15 2018-06-15 中南大学 文本情感分析方法、系统及计算机可读存储介质
CN108319666B (zh) * 2018-01-19 2021-09-28 国网浙江省电力有限公司营销服务中心 一种基于多模态舆情分析的供电服务评估方法
CN108536671B (zh) * 2018-03-07 2021-12-21 世纪龙信息网络有限责任公司 文本数据的情感指数识别方法和系统
CN110287477B (zh) * 2018-03-16 2021-05-25 北京国双科技有限公司 实体情感分析方法及相关装置
CN108509418A (zh) * 2018-03-20 2018-09-07 合肥工业大学 基于对话内容的用户异常情绪检测方法
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
CN108733644B (zh) * 2018-04-09 2019-07-19 平安科技(深圳)有限公司 一种文本情感分析方法、计算机可读存储介质及终端设备
CN108509629B (zh) * 2018-04-09 2022-05-13 南京大学 一种基于情感词典和支持向量机的文本情感分析方法
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
CN108717406B (zh) * 2018-05-10 2021-08-24 平安科技(深圳)有限公司 文本情绪分析方法、装置及存储介质
CN108959243A (zh) * 2018-05-17 2018-12-07 中国电子科技集团公司第二十八研究所 一种面向用户角色的通用舆论信息情感识别方法
CN108804416B (zh) * 2018-05-18 2022-08-09 大连民族大学 基于机器学习的影评情感倾向性分析的训练方法
CN108733652B (zh) * 2018-05-18 2022-08-09 大连民族大学 基于机器学习的影评情感倾向性分析的测试方法
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
CN110209806B (zh) * 2018-06-05 2023-09-12 腾讯科技(深圳)有限公司 文本分类方法、文本分类装置及计算机可读存储介质
CN108829672A (zh) * 2018-06-05 2018-11-16 平安科技(深圳)有限公司 文本的情感分析方法、装置、计算机设备和存储介质
CN110852111A (zh) * 2018-08-03 2020-02-28 天津大学 能同时过滤无关评论和对相关评论进行情感分类的方法
CN109190118A (zh) * 2018-08-16 2019-01-11 云南大学 基于流水线式神经网络的短语层次情感强度预测方法
CN109299252A (zh) * 2018-08-17 2019-02-01 北京奇虎科技有限公司 基于机器学习的股票评论的观点极性分类方法和装置
CN109359190B (zh) * 2018-08-17 2021-12-17 中国电子科技集团公司第三十研究所 一种基于评价对象阵营的立场分析模型构建方法
CN109271634B (zh) * 2018-09-17 2022-07-01 重庆理工大学 一种基于用户情感倾向感知的微博文本情感极性分析方法
CN109325231B (zh) * 2018-09-21 2023-07-04 中山大学 一种多任务模型生成词向量的方法
US11010561B2 (en) * 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
CN109192225B (zh) * 2018-09-28 2021-07-09 清华大学 语音情感识别和标注的方法及装置
CN110990559B (zh) * 2018-09-29 2023-08-04 北京国双科技有限公司 用于对文本进行分类的方法和装置、存储介质及处理器
CN109284504A (zh) * 2018-10-22 2019-01-29 平安科技(深圳)有限公司 利用深度学习模型的证券研报分析方法及装置
CN109522548A (zh) * 2018-10-26 2019-03-26 天津大学 一种基于双向交互神经网络的文本情感分析方法
CN111241271B (zh) * 2018-11-13 2023-04-25 网智天元科技集团股份有限公司 文本情感分类方法、装置及电子设备
CN109271493B (zh) * 2018-11-26 2021-10-08 腾讯科技(深圳)有限公司 一种语言文本处理方法、装置和存储介质
CN111241809B (zh) * 2018-11-29 2024-02-09 深港产学研基地产业发展中心 模型建立方法、装置、计算机设备和存储介质
CN109657207B (zh) * 2018-11-29 2023-11-03 爱保科技有限公司 条款的格式化处理方法和处理装置
US11132511B2 (en) * 2019-02-05 2021-09-28 International Business Machines Corporation System for fine-grained affective states understanding and prediction
CN109902174B (zh) * 2019-02-18 2023-06-20 山东科技大学 一种基于方面依赖的记忆网络的情感极性检测方法
CN109992770A (zh) * 2019-03-04 2019-07-09 昆明理工大学 一种基于组合神经网络的老挝语命名实体识别方法
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN110390097A (zh) * 2019-06-05 2019-10-29 北京大学(天津滨海)新一代信息技术研究院 一种基于应用内实时数据的情感分析方法和系统
CN110502744B (zh) * 2019-07-15 2021-05-11 同济大学 一种针对历史公园评价的文本情感识别方法及装置
CN110414819B (zh) * 2019-07-19 2023-05-26 中国电信集团工会上海市委员会 一种工单评分方法
CN110516242A (zh) * 2019-08-26 2019-11-29 北京亚联之星信息技术有限公司 基于机器学习算法识别负面金融资讯的方法和装置
CN110609899B (zh) * 2019-08-29 2022-04-19 成都信息工程大学 一种基于改进bert模型的特定目标情感分类方法
CN110851593B (zh) * 2019-09-23 2024-01-05 天津大学 一种基于位置与语义的复值词向量构建方法
CN110619125A (zh) * 2019-09-25 2019-12-27 南京涌亿思信息技术有限公司 一种基于深度学习的市场情报大数据分析方法和装置
CN111160037B (zh) * 2019-12-02 2021-10-26 广州大学 一种支持跨语言迁移的细粒度情感分析方法
CN110717339B (zh) * 2019-12-12 2020-06-30 北京百度网讯科技有限公司 语义表示模型的处理方法、装置、电子设备及存储介质
EP3839763A1 (en) 2019-12-16 2021-06-23 Tata Consultancy Services Limited System and method to quantify subject-specific sentiment
CN111008527A (zh) * 2019-12-18 2020-04-14 成都迪普曼林信息技术有限公司 一种情感分析系统及方法
CN111144097B (zh) * 2019-12-25 2023-08-18 华中科技大学鄂州工业技术研究院 一种对话文本的情感倾向分类模型的建模方法和装置
CN111353044B (zh) * 2020-03-09 2022-11-11 重庆邮电大学 一种基于评论的情感分析方法及系统
CN111553165B (zh) * 2020-03-15 2022-03-18 北京理工大学 一种基于情感计算的足球运动员比赛表现评估方法
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
CN111767741B (zh) * 2020-06-30 2023-04-07 福建农林大学 一种基于深度学习和tfidf算法的文本情感分析方法
CN111881676B (zh) * 2020-07-03 2024-03-15 南京航空航天大学 一种基于词向量和情感词性的情感分类方法
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN111967251B (zh) * 2020-07-28 2024-01-12 中国第一汽车股份有限公司 客户声音智慧洞察系统
CN111858945B (zh) * 2020-08-05 2024-04-23 上海哈蜂信息科技有限公司 基于深度学习的评论文本方面级情感分类方法及系统
CN112257452B (zh) * 2020-09-21 2024-05-14 北京达佳互联信息技术有限公司 情感识别模型的训练方法、装置、设备和存储介质
CN112199956B (zh) * 2020-11-02 2023-03-24 天津大学 一种基于深度表示学习的实体情感分析方法
CN112989033B (zh) * 2020-12-03 2022-05-17 昆明理工大学 基于情绪类别描述的微博情绪分类方法
CN113781085A (zh) * 2021-01-20 2021-12-10 北京沃东天骏信息技术有限公司 信息生成方法、装置、电子设备和计算机可读介质
CN112883724A (zh) * 2021-02-03 2021-06-01 虎博网络技术(上海)有限公司 文本数据增强处理方法、装置、电子设备和可读存储介质
CN112818698B (zh) * 2021-02-03 2022-07-15 北京航空航天大学 一种基于双通道模型的细粒度的用户评论情感分析方法
CN112800180A (zh) * 2021-02-04 2021-05-14 北京易车互联信息技术有限公司 一种点评文本标签的自动提取方案
CN113378581B (zh) * 2021-06-25 2023-06-06 浙江工商大学 一种基于多元概念注意力模型的知识追踪方法及系统
CN113408269A (zh) * 2021-07-20 2021-09-17 北京百度网讯科技有限公司 文本情感分析方法和装置
CN117494727B (zh) * 2023-12-29 2024-03-29 卓世科技(海南)有限公司 用于大语言模型的去偏倚方法
CN117521639B (zh) * 2024-01-05 2024-04-02 湖南工商大学 一种结合学术文本结构的文本检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930503A (zh) * 2016-05-09 2016-09-07 清华大学 基于组合特征向量和深度学习的情感分类方法及装置
CN106294845A (zh) * 2016-08-19 2017-01-04 清华大学 基于权重学习和多特征抽取的多情绪分类方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120253792A1 (en) * 2011-03-30 2012-10-04 Nec Laboratories America, Inc. Sentiment Classification Based on Supervised Latent N-Gram Analysis

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930503A (zh) * 2016-05-09 2016-09-07 清华大学 基于组合特征向量和深度学习的情感分类方法及装置
CN106294845A (zh) * 2016-08-19 2017-01-04 清华大学 基于权重学习和多特征抽取的多情绪分类方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Chinese comments sentiment classification based on word2vec and SVM;DongwenZhang 等;《Expert Systems with Applications》;20150330;第42卷(第4期);第1857-1863页 *
基于word2vec的文本情感分析方法研究;彭晓彬;《网络安全技术与应用》;20160715;第2016年卷(第7期);第58-59页 *

Also Published As

Publication number Publication date
CN106776581A (zh) 2017-05-31

Similar Documents

Publication Publication Date Title
CN106776581B (zh) 基于深度学习的主观性文本情感分析方法
CN110245229B (zh) 一种基于数据增强的深度学习主题情感分类方法
CN107609132B (zh) 一种基于语义本体库中文文本情感分析方法
CN106919673A (zh) 基于深度学习的文本情绪分析系统
CN110427623A (zh) 半结构化文档知识抽取方法、装置、电子设备及存储介质
CN111931506B (zh) 一种基于图信息增强的实体关系抽取方法
CN109960728B (zh) 一种开放域会议信息命名实体识别方法及系统
CN107818084B (zh) 一种融合点评配图的情感分析方法
Timmaraju et al. Sentiment analysis on movie reviews using recursive and recurrent neural network architectures
CN112906397B (zh) 一种短文本实体消歧方法
CN112417854A (zh) 中文文档抽取式摘要方法
CN112163089A (zh) 一种融合命名实体识别的军事高技术文本分类方法及系统
Chen et al. Chinese Weibo sentiment analysis based on character embedding with dual-channel convolutional neural network
Ji et al. A deep learning method for named entity recognition in bidding document
Zim et al. Exploring Word2Vec embedding for sentiment analysis of Bangla raw and romanized text
Cai et al. Multi-view and attention-based bi-lstm for weibo emotion recognition
Abdelfattah et al. ArSentBERT: fine-tuned bidirectional encoder representations from transformers model for Arabic sentiment classification
CN115906824A (zh) 一种文本细粒度情感分析方法、系统、介质和计算设备
Nazarizadeh et al. Sentiment analysis of Persian language: review of algorithms, approaches and datasets
Mulki et al. Syntax-ignorant N-gram embeddings for dialectal Arabic sentiment analysis
Karimi et al. Sentiment analysis using BERT (pre-training language representations) and Deep Learning on Persian texts
CN114626367A (zh) 基于新闻文章内容的情感分析方法、系统、设备及介质
CN113901813A (zh) 一种基于主题特征和隐式句子结构的事件抽取方法
CN113869054A (zh) 一种基于深度学习的电力领域项目特征识别方法
Nsaif et al. Political Post Classification based on Firefly and XG Boost

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant