CN109684646A - 一种基于话题影响力的微博话题情感分析方法 - Google Patents
一种基于话题影响力的微博话题情感分析方法 Download PDFInfo
- Publication number
- CN109684646A CN109684646A CN201910036276.8A CN201910036276A CN109684646A CN 109684646 A CN109684646 A CN 109684646A CN 201910036276 A CN201910036276 A CN 201910036276A CN 109684646 A CN109684646 A CN 109684646A
- Authority
- CN
- China
- Prior art keywords
- topic
- text
- microblogging
- microblog
- influence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 66
- 230000002996 emotional effect Effects 0.000 claims abstract description 27
- 230000008451 emotion Effects 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 7
- 238000005070 sampling Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 201000004569 Blindness Diseases 0.000 abstract 1
- 238000012544 monitoring process Methods 0.000 abstract 1
- 239000013598 vector Substances 0.000 description 7
- 244000097202 Rathbunia alamosensis Species 0.000 description 4
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000036632 reaction speed Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Abstract
本发明公开了一种基于话题影响力的微博话题情感分析方法,该方法包括以下步骤:采集微博用户个人信息数据及微博文本数据;对数据进行预处理;使用LDA模型进行主题聚类;选取话题的微博内容进行情感极性标注并训练生成SVM分类器;使用SVM分类器得到未标注文本的情感倾向性;计算微博用户影响力因子值及该微博与话题相似度,结合微博情感极性和话题影响力因子计算整个话题的情感值,并以此对话题进行排序,为舆情分析提供参考。本发明能及时发现微博文本的话题中可能突发的舆情事件及热点话题,并根据话题影响力对话题舆情度进行排序,可应用于网络舆情监管和突发舆情事件的监测,解决目前舆情系统监管不及时性和盲目性问题。
Description
技术领域
本发明涉及一种基于话题影响力的微博话题情感分析方法,属于大数据以及文本挖掘技术领域。
背景技术
在当今的信息时代,人们越来越依赖于网络,也越来越习惯在社交网络上去获取信息、交流信息及表达自己的个人情感;新浪微博等社交平台拥有庞大的微博用户量和用户通过使用微博而产生的庞大数据,这些数据背后都蕴含着巨大的商业价值和社会价值。因此与微博相关的研究课题越来越受到我们的关注,而微博情感分析以及背后更深层次的舆情分析更是这些课题中的热点。
情感分析又称意见挖掘,其目的是通过对带有个人主观情感或者分析文本进行分析,挖掘其中的个人观点或评价信息,以更加直观的方式或者形式呈现给我们。微博由于文字限制,文本通常比较短小,且表达方式比较自由,对于语法结构要求也比较宽松,因此针对微博进行情感分析具有一定的难度。
现有技术中,微博情感分析方法主要分为两种:一种是基于情感语义词典的方法,一种是基于机器学习的方法。使用情感词典来分析文本情感,应用于词语特征级,分析精度高,但是受到NLP技术及相关抽取技术的限制,容易丢失数据集中隐藏的重要模式;使用机器学习的方法来进行分析主要是通过学习大量的数据来训练出分类模型,该方法对于情感分析比较客观,准确性高,但是对于训练语料依赖性很高,训练周期较长。
发明内容
针对上述问题,本发明提出了一种基于话题影响力的微博话题情感分析方法,实现了客观且精准的情感分析,并根据情感分析的结果做出舆情预警。
具体的技术方案如下:
一种基于话题影响力的微博话题情感分析方法,包括以下步骤:
步骤1,通过微博提供的API接口获取微博用户的个人信息数据,包括用户的用户微博数、粉丝数、关注数、评论数;采用网络爬虫方式获取大量微博文本;
步骤2,对微博文本进行数据预处理,包括过滤噪声、分词和去停用词;
步骤3,将微博文本按照自带hashtag进行粗分类,使用LDA模型进一步进行主题聚类:微博文本中经常会出现##话题,首先我们可以初步按照自带话题标签对微博文本进行分类;其次利用LDA模型得到主题分布,将微博文本进一步地细分为各主题区间;
步骤4,对部分微博文本进行情感极性标注,若该条微博文本情感倾向为正向,则标记为1,否则标记为-1;利用标注微博文本集进行训练并优化,生成SVM情感分类器;使用SVM分类器得到未标注微博文本情感极值;
步骤5,根据步骤1所采集到数据计算用户影响力和话题内该用户发布的微博文本与话题相似度来计算该文本的话题影响力;
步骤6,计算出该微博文本的主流情感倾向及情感值并对话题情感值进行排序;感极性值P接近0,则该话题为中性;P>0,则该话题为正向;P<0代表该话题为负面情绪;若一个话题负向情感值极高,则说明该话题很有可能引起突发舆情事件,应做出舆情预警。
步骤3中LDA模型进行主题聚类的方法为:
过程3.1,根据已有标签的微博文本语料库进行学习,生成LDA主题模型;具体LDA主题模型生成过程可以描述如下:
3.1.1,文本d中词项总数Nd服从泊松分布,其参数为ξ:Nd~Poisson(ξ);
3.1.2,对每篇文档d,按概率生成其主题分布:
3.1.3,对每个主题z,按概率生成其词项分布:
3.1.4,根据主题分布和词语分布生成文本中的每一个词语;
过程3.2,采用Gibbs抽样算法对生成的LDA主题模型进行主题抽取;
过程3.3,对需要进行主题分类的文本利用Gibbs抽样算法推断其主题分布概率。
步骤4中SVM分类器预测未标注文本情感倾向的方法为:
过程4.1,选取部分微博文本进行人工标注作为训练集,其余采集的未标注微博文本作为测试集;
过程4.2,特征提取,选取一些文本特征进行训练,包括词性、情感词、否定词、程度副词及特殊符号;
过程4.3,对特征进行降维,不断优化模型直至生成SVM分类器;
过程4.4,利用SVM分类器预测得到微博情感极值。
步骤5中话题影响力和话题情感值的计算方法为:
过程5.1,根据采集到的用户数据进行标准化和归一化处理,筛选用户的微博发布数、评论数、粉丝数和被提及次数;计算出对于话题传播影响最大的属性特征值——活跃度H、传播力C、覆盖度G;通过用户影响力计算公式来得到用户影响力;
过程5.2,通过TF-IDF算法计算文本内容和话题的相似度作为话题影响力的因子;
过程5.3,根据用户影响力以及微博相似度来计算该条微博文本的话题影响力。
进一步的,过程5.1中,微波发布数包括原创和转发微博的总数。
步骤6中话题的主流情感倾向及情感值的计算方法为:
过程6.1,选取一段时间,统计该段时间内话题内发布微博的用户数;
过程6.2,根据SVM分类器的情感极性预测结果计算情感极性为正、负向的用户集合;
过程6.3,根据不同用户的不同微博文本的话题影响力来计算整个话题的情感倾向及情感值。
本发明的有益效果为:
本发明实现了客观且精准的情感分析,并根据情感分析的结果做出舆情预警,分析的准确性高,训练周期短,加快了反应速度。
附图说明
图1为本发明的方法流程图。
具体实施方式
为使本发明的技术方案更加清晰明确,下面结合附图对本发明进行进一步描述,任何对本发明技术方案的技术特征进行等价替换和常规推理得出的方案均落入本发明保护范围。
一种基于话题影响力的微博话题情感分析方法,其具体步骤如下:
步骤1,通过微博提供的API接口获取微博用户的个人信息数据,包括用户的用户微博数、粉丝数、关注数、评论数;登录新浪微博的开放平台,在Python下安装SDK,进行OAuth 2认证,访问创建的应用后将页面导向新浪服务器然后输入信息到新浪服务器后授权给应用访问用户数据;采用网络爬虫方式获取大量微博文本;
步骤2,对微博文本进行数据预处理,包括过滤噪声、分词和去停用词;保留微博文本的hashtag标签以及表情符号,并将表情符号转化为对应的文本信息;
步骤3,将微博按照自带hashtag标签分类到对应的微博话题中;没有自带标签的文本使用LDA主题模型进行主题聚类,细分到对应的微博话题中;使用LDA主题模型进行话题聚类的计算过程具体分为以下过程:
过程3.1,根据已有选定的话题标签的微博文本语料库进行学习,生成LDA主题模型;具体LDA主题模型生成过程可以描述如下:
3.1.1,文本d中词项总数Nd服从泊松分布,其参数为ξ:Nd~Poisson(ξ);
3.1.2,对每篇文档d,按概率生成其主题分布:
3.1.3,对每个主题z,按概率生成其词项分布:
3.1.4,根据主题分布和词语分布生成文本中的每一个词语;
LDA模型生成过程中,所有观测变量和隐含变量在给定超参数下联合概率为:
过程3.2,采用Gibbs抽样算法对生成的LDA主题模型进行主题抽取;由于LDA主题模型中计算隐含变量联合分布较为复杂,因此采用常用的Gibbs抽样算法来进行主题抽取,其采样过程及公式如下:
3.2.1,选择合适的主题数K,选择合适的超参数向量
3.2.2,对应语料库中每一篇文档的每一个词,随机赋予一个主题;
3.2.3,重新扫描语料库,对于每一个词,利用Gibbs采样公式更新它的主题;
3.2.4,重复3.2.3基于坐标轴轮换的Gibbs采样过程,直到Gibbs采样收敛;
3.2.5,统计语料库中的各文档各词的主题,得到文档主题分布和词语分布;
其中,zi=j表示将词语i分配给主题k,表示除去i的词,表示除去词语i的词向量,表示除去词i的主题向量,表示与词项wi相同的分配主题为k的词项数,表示文档m中分配主题为k的词项数,W为不计重复的词汇总数,K为选定的主题数,αz为主题z在微博m中出现的先验概率,βw为词语w在主题z中出现的先验概率;
过程3.3,对需要进行主题分类的文本利用Gibbs抽样算法推断其主题分布概率。
其中,代表微博文本m中主题为k的词汇数目,αk为主题k在微博m中出现的先验概率。
步骤4,对部分微博文本进行情感极性标注,若该条微博情感倾向为正向,则标记为1,否则标记为-1;利用标注微博文本集进行训练并优化,生成SVM情感分类器;使用SVM分类器得到未标注微博文本情感极值;具体过程如下:
过程4.1,选取部分微博文本进行人工标注作为训练集,其余采集的未标注微博文本作为测试集;
过程4.2,特征提取,选取一些文本特征进行训练,包括词性、情感词、否定词、程度副词及特殊符号;
过程4.3,对特征进行降维,不断优化模型直至生成SVM分类器;
过程4.4,利用SVM分类器预测得到微博情感极值;
步骤5,根据步骤1所采集到数据计算用户影响力和话题内该用户发布的微博与话题相似度来计算该条微博的话题影响力;具体过程如下:
过程5.1,通过用户影响力计算公式来计算用户影响力;
Y=ω1×F+ω2×H+ω3×C
其中,F=a∩b∩c代表用户影响覆盖度,a代表粉丝用户集合,b代表评论用户集合,c代表转发用户集合,代表用户活跃度,d代表一段时间内用户发布微博数(包括原创微博和转发微博),e代表一段时间内用户评论的微博数,代表用户传播力,f代表该用户微博平均被转发数,g代表该用户微博平均被评论数,T代表选取时间时长,ωi代表各参数权值;
过程5.2,使用余弦相似度算法计算用户微博与话题的相似度,具体过程如下:
5.2.1,使用TF-IDF算法,找出一篇微博文本和该话题初始文本的关键词;测试集文本进行分词后,统计每个文档中每个词语的词频TF,计算每个词的逆文档频率IDF,从而计算出每个词语的TF-IDF值;根据词语TF-IDF值选择排序靠前的关键词作为每篇文本的关键词;
其中,N代表语料库中文本的总数,而N(x)代表语料库中包含词x的文本总数。
在一些特殊的情况下该公式会有一些小问题,比如某一个生僻词在语料库中不存在,此时公式中分母为0,IDF则没有意义。所以我们需要做一些平滑,使语料库中没有出现的词也可以得到一个合适的IDF值。IDF平滑后的公式之为:
则
TF-IDF(x)=TF(x)*IDF(x)
其中TF(x)代表词x在当前文本中的词频;
5.2.2,两篇微博各取出若干个关键词(为公平起见,一般取的词数相同),合并成一个集合,计算每篇文章对于这个集合中的词的词频;为了避免文章长度的差异,可以使用相对词频;选出的不同词的数量决定了词频向量的长度;
5.2.3,生成两篇文章各自的词频向量;所有文章对应的词频向量等长,相同位置的元素对应同一词;
5.2.4,计算两个向量的余弦相似度,值越大就表示越相似;一般情况下,相似度都是归一化到[0,1]区间内;
其中,Ai代表话题内任一微博文本的关键词,Bi代表该话题初始文本的关键词;
过程5.3,计算该微博文本的话题影响力;
Yz=cosθ×Y
步骤6,计算出该微博文本的话题的主流情感倾向及情感值并对话题情感值进行排序;情感极性值P接近0,则该话题为中性;P>0,则该话题为正向;P<0代表该话题为负面情绪;若一个话题负向情感值极高,则说明该话题很有可能引起突发舆情事件,应做出舆情预警。具体过程如下:
过程6.1,选取一段时间,统计该段时间内发布微博的用户数;
过程6.2,根据SVM分类器的情感极性预测结果计算情感极性为正、负向的用户集合;
过程6.3,根据不同用户的不同微博文本的话题影响力来计算整个话题的情感倾向及情感值
其中,Ppos代表情感极性为正向的情感值总和,Pneg代表情感极性为负向的情感值总和,Npos代表情感极性为正向的话题内用户,Nneg代表情感极性为负向的话题内用户,N代表一段时间内发布微博的用户数。
Claims (6)
1.一种基于话题影响力的微博话题情感分析方法,其特征为,包括以下步骤:
步骤1,通过微博提供的API接口获取微博用户的个人信息数据,包括用户的用户微博数、粉丝数、关注数、评论数;采用网络爬虫方式获取大量微博文本;
步骤2,对微博文本进行数据预处理,包括过滤噪声、分词和去停用词;
步骤3,将微博文本按照自带hashtag进行粗分类,使用LDA模型进一步进行主题聚类:微博文本中经常会出现##话题,首先我们可以初步按照自带话题标签对微博文本进行分类;其次利用LDA模型得到主题分布,将微博文本进一步地细分为各主题区间;
步骤4,对部分微博文本进行情感极性标注,若该条微博文本情感倾向为正向,则标记为1,否则标记为-1;利用标注微博文本集进行训练并优化,生成SVM情感分类器;使用SVM分类器得到未标注微博文本情感极值;
步骤5,根据步骤1所采集到数据计算用户影响力和话题内该用户发布的微博文本与话题相似度来计算该文本的话题影响力;
步骤6,计算出该微博文本的主流情感倾向及情感值并对话题情感值进行排序;感极性值P接近0,则该话题为中性;P>0,则该话题为正向;P<0代表该话题为负面情绪;若一个话题负向情感值极高,则说明该话题很有可能引起突发舆情事件,应做出舆情预警。
2.如权利要求1所述的一种基于话题影响力的微博话题情感分析方法,其特征为,步骤3中LDA模型进行主题聚类的方法为:
过程3.1,根据已有标签的微博文本语料库进行学习,生成LDA主题模型;具体LDA主题模型生成过程可以描述如下:
3.1.1,文本d中词项总数Nd服从泊松分布,其参数为ξ:Nd~Poisson(ξ);
3.1.2,对每篇文档d,按概率生成其主题分布:
3.1.3,对每个主题z,按概率生成其词项分布:
3.1.4,根据主题分布和词语分布生成文本中的每一个词语;
LDA模型生成过程中,所有观测变量和隐含变量在给定超参数下联合概率为
过程3.2,采用Gibbs抽样算法对生成的LDA主题模型进行主题抽取;
过程3.3,对需要进行主题分类的文本利用Gibbs抽样算法推断其主题分布概率。
3.如权利要求1所述的一种基于话题影响力的微博话题情感分析方法,其特征为,步骤4中SVM分类器预测未标注文本情感倾向的方法为:
过程4.1,选取部分微博文本进行人工标注作为训练集,其余采集的未标注微博文本作为测试集;
过程4.2,特征提取,选取一些文本特征进行训练,包括词性、情感词、否定词、程度副词及特殊符号;
过程4.3,对特征进行降维,不断优化模型直至生成SVM分类器;
过程4.4,利用SVM分类器预测得到微博情感极值。
4.如权利要求1所述的一种基于话题影响力的微博话题情感分析方法,其特征为,步骤5中话题影响力和话题情感值的计算方法为:
过程5.1,根据采集到的用户数据进行标准化和归一化处理,筛选用户的微博发布数、评论数、粉丝数和被提及次数;计算出对于话题传播影响最大的属性特征值——活跃度H、传播力C、覆盖度G;通过用户影响力计算公式来得到用户影响力;
过程5.2,通过TF-IDF算法计算文本内容和话题的相似度作为话题影响力的因子;
过程5.3,根据用户影响力以及微博相似度来计算该条微博文本的话题影响力。
5.如权利要求4所述的一种基于话题影响力的微博话题情感分析方法,其特征为,过程5.1中,微波发布数包括原创和转发微博的总数。
6.如权利要求1所述的一种基于话题影响力的微博话题情感分析方法,其特征为,步骤6中话题的主流情感倾向及情感值的计算方法为:
过程6.1,选取一段时间,统计该段时间内话题内发布微博的用户数;
过程6.2,根据SVM分类器的情感极性预测结果计算情感极性为正、负向的用户集合;
过程6.3,根据不同用户的不同微博文本的话题影响力来计算整个话题的情感倾向及情感值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910036276.8A CN109684646A (zh) | 2019-01-15 | 2019-01-15 | 一种基于话题影响力的微博话题情感分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910036276.8A CN109684646A (zh) | 2019-01-15 | 2019-01-15 | 一种基于话题影响力的微博话题情感分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109684646A true CN109684646A (zh) | 2019-04-26 |
Family
ID=66192290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910036276.8A Pending CN109684646A (zh) | 2019-01-15 | 2019-01-15 | 一种基于话题影响力的微博话题情感分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109684646A (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110297986A (zh) * | 2019-06-21 | 2019-10-01 | 山东科技大学 | 一种微博热点话题的情感倾向分析方法 |
CN110674300A (zh) * | 2019-09-30 | 2020-01-10 | 京东城市(北京)数字科技有限公司 | 用于生成信息的方法和装置 |
CN110727798A (zh) * | 2019-10-15 | 2020-01-24 | 东北大学 | 一种基于朴素贝叶斯分类的节日情感分析方法 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111310476A (zh) * | 2020-02-21 | 2020-06-19 | 山东大学 | 一种使用基于方面的情感分析方法的舆情监控方法和系统 |
CN111309864A (zh) * | 2020-02-11 | 2020-06-19 | 安徽理工大学 | 一种微博热点话题的用户群体情感倾向迁移动态分析方法 |
CN111339247A (zh) * | 2020-02-11 | 2020-06-26 | 安徽理工大学 | 一种微博子话题用户评论情感倾向性分析方法 |
CN111444404A (zh) * | 2020-03-19 | 2020-07-24 | 杭州叙简科技股份有限公司 | 一种基于微博的社会舆情监测系统及其监测方法 |
CN111611455A (zh) * | 2020-05-22 | 2020-09-01 | 安徽理工大学 | 一种微博热点话题下基于用户情感行为特征的用户群体划分方法 |
CN111694952A (zh) * | 2020-04-16 | 2020-09-22 | 国家计算机网络与信息安全管理中心 | 一种基于微博的大数据分析模型系统及其实现方法 |
CN112052869A (zh) * | 2020-07-14 | 2020-12-08 | 北京工业大学 | 一种用户心理状态识别方法及系统 |
CN112052995A (zh) * | 2020-08-31 | 2020-12-08 | 杭州电子科技大学 | 基于融合情感倾向主题的社交网络用户影响力预测方法 |
CN112115712A (zh) * | 2020-09-08 | 2020-12-22 | 北京交通大学 | 基于话题的群体情感分析方法 |
CN112182152A (zh) * | 2020-09-24 | 2021-01-05 | 东北大学 | 基于深度学习的新浪微博用户情感影响力分析方法 |
CN112199607A (zh) * | 2020-10-30 | 2021-01-08 | 天津大学 | 基于可变邻域内平行社交上下文融合的微博主题挖掘方法 |
CN112434164A (zh) * | 2020-12-03 | 2021-03-02 | 西安交通大学 | 一种兼顾话题发现和情感分析的网络舆情分析方法及系统 |
CN112541361A (zh) * | 2020-12-11 | 2021-03-23 | 中信银行股份有限公司 | 一种针对特定业务对象的舆情处理方法及装置 |
CN113064989A (zh) * | 2020-11-19 | 2021-07-02 | 龚越 | 一种交通舆情感知特征模块及分析治理应用 |
CN113064991A (zh) * | 2021-03-17 | 2021-07-02 | 西北工业大学 | 一种基于人机协作的微博事件真假检测方法 |
CN113449508A (zh) * | 2021-07-15 | 2021-09-28 | 上海理工大学 | 一种基于事件链的网络舆情关联推演预测分析方法 |
CN113536089A (zh) * | 2021-07-07 | 2021-10-22 | 中国电子科技集团公司第五十四研究所 | 一种基于lbs定位的景区游客行为感知监测方法 |
CN113641867A (zh) * | 2021-08-16 | 2021-11-12 | 中国科学院自动化研究所 | 基于微博舆情的城市间关系测度系统、方法、设备 |
CN114580373A (zh) * | 2022-02-22 | 2022-06-03 | 四川大学 | 一种结合文本主题分析、情感分析和gsvm的智慧环保宣教方法 |
CN117093762A (zh) * | 2023-07-18 | 2023-11-21 | 南京特尔顿信息科技有限公司 | 一种舆情数据评估分析系统及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120041953A1 (en) * | 2010-08-16 | 2012-02-16 | Microsoft Corporation | Text mining of microblogs using latent topic labels |
CN104123352A (zh) * | 2014-07-10 | 2014-10-29 | 西安理工大学 | 面向微博的话题层次用户影响力度量方法 |
CN106294334A (zh) * | 2015-05-11 | 2017-01-04 | 国家计算机网络与信息安全管理中心 | 一种微博舆情指标体系的计算方法及装置 |
CN106980692A (zh) * | 2016-05-30 | 2017-07-25 | 国家计算机网络与信息安全管理中心 | 一种基于微博特定事件的影响力计算方法 |
CN108563638A (zh) * | 2018-04-13 | 2018-09-21 | 武汉大学 | 一种基于主题识别和集成学习的微博情感分析方法 |
-
2019
- 2019-01-15 CN CN201910036276.8A patent/CN109684646A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120041953A1 (en) * | 2010-08-16 | 2012-02-16 | Microsoft Corporation | Text mining of microblogs using latent topic labels |
CN104123352A (zh) * | 2014-07-10 | 2014-10-29 | 西安理工大学 | 面向微博的话题层次用户影响力度量方法 |
CN106294334A (zh) * | 2015-05-11 | 2017-01-04 | 国家计算机网络与信息安全管理中心 | 一种微博舆情指标体系的计算方法及装置 |
CN106980692A (zh) * | 2016-05-30 | 2017-07-25 | 国家计算机网络与信息安全管理中心 | 一种基于微博特定事件的影响力计算方法 |
CN108563638A (zh) * | 2018-04-13 | 2018-09-21 | 武汉大学 | 一种基于主题识别和集成学习的微博情感分析方法 |
Non-Patent Citations (1)
Title |
---|
邹海林等: "基于依存句法的评论情感极性分析", 《贵州师范大学学报(自然科学版)》 * |
Cited By (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110297986A (zh) * | 2019-06-21 | 2019-10-01 | 山东科技大学 | 一种微博热点话题的情感倾向分析方法 |
CN110674300A (zh) * | 2019-09-30 | 2020-01-10 | 京东城市(北京)数字科技有限公司 | 用于生成信息的方法和装置 |
CN110727798A (zh) * | 2019-10-15 | 2020-01-24 | 东北大学 | 一种基于朴素贝叶斯分类的节日情感分析方法 |
CN111160019A (zh) * | 2019-12-30 | 2020-05-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111160019B (zh) * | 2019-12-30 | 2023-08-15 | 中国联合网络通信集团有限公司 | 一种舆情监测的方法、装置及系统 |
CN111309864B (zh) * | 2020-02-11 | 2022-08-26 | 安徽理工大学 | 一种微博热点话题的用户群体情感倾向迁移动态分析方法 |
CN111309864A (zh) * | 2020-02-11 | 2020-06-19 | 安徽理工大学 | 一种微博热点话题的用户群体情感倾向迁移动态分析方法 |
CN111339247A (zh) * | 2020-02-11 | 2020-06-26 | 安徽理工大学 | 一种微博子话题用户评论情感倾向性分析方法 |
CN111339247B (zh) * | 2020-02-11 | 2022-10-28 | 安徽理工大学 | 一种微博子话题用户评论情感倾向性分析方法 |
CN111310476A (zh) * | 2020-02-21 | 2020-06-19 | 山东大学 | 一种使用基于方面的情感分析方法的舆情监控方法和系统 |
CN111444404A (zh) * | 2020-03-19 | 2020-07-24 | 杭州叙简科技股份有限公司 | 一种基于微博的社会舆情监测系统及其监测方法 |
CN111694952A (zh) * | 2020-04-16 | 2020-09-22 | 国家计算机网络与信息安全管理中心 | 一种基于微博的大数据分析模型系统及其实现方法 |
CN111611455A (zh) * | 2020-05-22 | 2020-09-01 | 安徽理工大学 | 一种微博热点话题下基于用户情感行为特征的用户群体划分方法 |
CN112052869A (zh) * | 2020-07-14 | 2020-12-08 | 北京工业大学 | 一种用户心理状态识别方法及系统 |
CN112052995B (zh) * | 2020-08-31 | 2023-08-01 | 杭州电子科技大学 | 基于融合情感倾向主题的社交网络用户影响力预测方法 |
CN112052995A (zh) * | 2020-08-31 | 2020-12-08 | 杭州电子科技大学 | 基于融合情感倾向主题的社交网络用户影响力预测方法 |
CN112115712B (zh) * | 2020-09-08 | 2024-02-02 | 北京交通大学 | 基于话题的群体情感分析方法 |
CN112115712A (zh) * | 2020-09-08 | 2020-12-22 | 北京交通大学 | 基于话题的群体情感分析方法 |
CN112182152A (zh) * | 2020-09-24 | 2021-01-05 | 东北大学 | 基于深度学习的新浪微博用户情感影响力分析方法 |
CN112182152B (zh) * | 2020-09-24 | 2021-09-03 | 东北大学 | 基于深度学习的新浪微博用户情感影响力分析方法 |
CN112199607A (zh) * | 2020-10-30 | 2021-01-08 | 天津大学 | 基于可变邻域内平行社交上下文融合的微博主题挖掘方法 |
CN113064989A (zh) * | 2020-11-19 | 2021-07-02 | 龚越 | 一种交通舆情感知特征模块及分析治理应用 |
CN113064989B (zh) * | 2020-11-19 | 2022-12-02 | 龚越 | 一种交通舆情感知特征提取方法 |
CN112434164B (zh) * | 2020-12-03 | 2023-04-28 | 西安交通大学 | 一种兼顾话题发现和情感分析的网络舆情分析方法及系统 |
CN112434164A (zh) * | 2020-12-03 | 2021-03-02 | 西安交通大学 | 一种兼顾话题发现和情感分析的网络舆情分析方法及系统 |
CN112541361A (zh) * | 2020-12-11 | 2021-03-23 | 中信银行股份有限公司 | 一种针对特定业务对象的舆情处理方法及装置 |
CN113064991B (zh) * | 2021-03-17 | 2024-04-19 | 西北工业大学 | 一种基于人机协作的微博事件真假检测方法 |
CN113064991A (zh) * | 2021-03-17 | 2021-07-02 | 西北工业大学 | 一种基于人机协作的微博事件真假检测方法 |
CN113536089A (zh) * | 2021-07-07 | 2021-10-22 | 中国电子科技集团公司第五十四研究所 | 一种基于lbs定位的景区游客行为感知监测方法 |
CN113449508A (zh) * | 2021-07-15 | 2021-09-28 | 上海理工大学 | 一种基于事件链的网络舆情关联推演预测分析方法 |
CN113641867B (zh) * | 2021-08-16 | 2023-07-14 | 中国科学院自动化研究所 | 基于微博舆情的城市间关系测度系统、方法、设备 |
CN113641867A (zh) * | 2021-08-16 | 2021-11-12 | 中国科学院自动化研究所 | 基于微博舆情的城市间关系测度系统、方法、设备 |
CN114580373A (zh) * | 2022-02-22 | 2022-06-03 | 四川大学 | 一种结合文本主题分析、情感分析和gsvm的智慧环保宣教方法 |
CN117093762A (zh) * | 2023-07-18 | 2023-11-21 | 南京特尔顿信息科技有限公司 | 一种舆情数据评估分析系统及方法 |
CN117093762B (zh) * | 2023-07-18 | 2024-02-13 | 南京特尔顿信息科技有限公司 | 一种舆情数据评估分析系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109684646A (zh) | 一种基于话题影响力的微博话题情感分析方法 | |
Rahman et al. | Sentiment analysis on movie review data using machine learning approach | |
Hazarika et al. | Cascade: Contextual sarcasm detection in online discussion forums | |
Jain et al. | Application of machine learning techniques to sentiment analysis | |
Tripathi et al. | Feature selection and classification approach for sentiment analysis | |
Vamshi et al. | Topic model based opinion mining and sentiment analysis | |
Zabha et al. | Developing cross-lingual sentiment analysis of Malay Twitter data using lexicon-based approach | |
CN110750648A (zh) | 一种基于深度学习和特征融合的文本情感分类方法 | |
Nigam et al. | Machine learning based approach to sentiment analysis | |
Mozafari et al. | Emotion detection by using similarity techniques | |
Garg et al. | A literature review on sentiment analysis techniques involving social media platforms | |
Hussein et al. | Cluster Analysis on covid-19 outbreak sentiments from twitter data using K-means algorithm | |
Nahar et al. | Sentiment analysis and emotion extraction: A review of research paradigm | |
Stojanovski et al. | Emotion identification in FIFA world cup tweets using convolutional neural network | |
Chamekh et al. | Sentiment analysis based on deep learning in e-commerce | |
Sinha et al. | A detailed survey and comparative study of sentiment analysis algorithms | |
Atoum | Detecting cyberbullying from tweets through machine learning techniques with sentiment analysis | |
Asriadie et al. | Classifying emotion in Twitter using Bayesian network | |
Tizhoosh et al. | Poetic features for poem recognition: A comparative study | |
Huang et al. | An unsupervised method for short-text sentiment analysis based on analysis of massive data | |
Frain et al. | SatiricLR: a language resource of satirical news articles | |
Suresha et al. | Topic Modeling and Sentiment Analysis of Electric Vehicles of Twitter Data | |
ul Mustafa et al. | Prediction of user’s interest based on urdu tweets | |
Bai et al. | An ensemble approach for cyber bullying: Text messages and images | |
Chavan et al. | Machine Learning Applied in Emotion Classification: A Survey on Dataset, Techniques, and Trends for Text Based Documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190426 |