CN103761239B - 一种利用表情符号对微博进行情感倾向分类的方法 - Google Patents

一种利用表情符号对微博进行情感倾向分类的方法 Download PDF

Info

Publication number
CN103761239B
CN103761239B CN201310664725.6A CN201310664725A CN103761239B CN 103761239 B CN103761239 B CN 103761239B CN 201310664725 A CN201310664725 A CN 201310664725A CN 103761239 B CN103761239 B CN 103761239B
Authority
CN
China
Prior art keywords
microblogging
emotion
emoticon
neutral
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310664725.6A
Other languages
English (en)
Other versions
CN103761239A (zh
Inventor
刘春阳
程工
张旭
庞琳
王卿
吴俊杰
王亚琼
李红
韩小汀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Original Assignee
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Computer Network and Information Security Management Center filed Critical National Computer Network and Information Security Management Center
Priority to CN201310664725.6A priority Critical patent/CN103761239B/zh
Publication of CN103761239A publication Critical patent/CN103761239A/zh
Application granted granted Critical
Publication of CN103761239B publication Critical patent/CN103761239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种根据表情符号对微博进行情感倾向分类的方法,包括:创建中性情感集、消极情感集和积极情感集;利用中性情感集、消极情感集和积极情感集,建立中性情感贝叶斯分类器;利用由消极情感集和积极情感集,建立极性情贝叶斯情感分类器;利用中性情感贝叶斯分类器和极性情感贝叶斯分类器对待测微博进行情感分类。本发明通过建立一个两阶段分类,即建立中性情感分类器,把中性情感的微博剔除,建立极性情感分类器,将有极性情感的微博分为积极情感和消极情感,该分类器分类速度快、占用空间小且鲁棒,且本发明能通过微博准确的了解到人们对当前的热门话题或事件的态度和网民的情绪,对社会科研和调查有着重要的帮助。

Description

一种利用表情符号对微博进行情感倾向分类的方法
技术领域
本发明涉及一种利用表情符号对微博进行情感倾向分类的方法。
背景技术
微博现今已经成为互联网上最耀眼的新兴互动平台,用户广泛接受并积极参与,其应用价值迅速获得认可。据2012年1月16日CNNIC发布的《第29次中国互联网络发展状况调查统计报告》统计,截至2011年12月底,中国网民规模突破5亿,微博用户数达到2.5亿,目前有近半数网民在使用,比例由2010年的13.8%增至2011年底的48.7%,微博较上一年底增长了296.0%。2.4亿多用户,每秒就能生成超过1000条微博。微博仅用一年时间就发展成为近一半中国网民使用的重要互联网应用。微博因为每次发布的文本相当短,又与博客应用不同的是,微博最初的使用方法就是用手机短信发送信息而不是通过电脑,这体现了微博的几个重要的特点:1.灵活性,用户无需像博客那样必须坐在电脑面前才能发布信息,而是随时随地;2.文本短,微博的内容都极为简洁,如twitter的文字上限为140个字符,中文微博大多为140个汉字,表达的信息非常有限;3.随意性,除了一些新闻媒体和机器人账号以外,大部分普通用户使用都不是为发表新闻而使用微博的,多数内容都是一时的所见所想,以及对别人发表内容的回复或转发等。此外,微博还具有极大的开放性,微博上的内容绝大部分是公开的,这意味着任何人进入微博后都能看到任何人的所有公开的微博,因此在微博上能获取的信息量极大。
由于微博这样的短文本有没足够的词语共现、特征稀疏,因此传统的分类方法,如“词袋法”就不能很好地作用在短文本上。如何对微博这样包含大量主题、形式随意的短文进行分类,已经成了文本挖掘领域的研究新阵地。
人们在博客、微博和各种网上社交网络上不断发表着自己对政治、经济、运动等话题的观点、看法。这样的基于文本的社会媒体平台的兴起,使得主题广泛的、海量的、带有观点的文本数据大量涌出,因此人们将目光聚集在数据挖掘上,期待能够自动区分这些带有观点和兴趣的内容,监测公众的观点、态度,展现线上社会群体的情绪,作为许多有价值的实时应用的基础。
发明内容
本发明设计开发了一种根据表情符号对微博进行情感倾向分类的方法。
本发明提供的技术方案为:
一种利用表情符号对微博进行情感倾向分类的方法,包括:
步骤一、创建中性情感集、消极情感集和积极情感集,具体为:
a、选取在两年中的新浪微博中使用次数超过20万次的表情符号m个,作为种子表情符号,对选取的每个种子表情符号都抽取包含这个表情符号的微博n条作为第一微博集,每个第一微博集包含n条第一微博,从m×n条第一微博的文本中提取重现性在前100的词作为高频词,对每个种子表情符号都选取包含有这个表情符号的微博p条,作为第二微博集,每个第二微博集包含p条第二微博,观察m×p条第二微博文本内容,若一条第二微博中包含的高频词与该条第二微博的文本的情感倾向一致,则认为该条第二微博中包含的种子表情符号的情感倾向明显,并提取该条第二微博中的种子表情符号作为基准表情符号,人工将基准表情符号分类为积极情感和消极情感;
b、所有积极情感的基准表情符号和所有含有积极情感的基准表情符号的第一微博组成积极情感集,所有消极情感的基准表情符号和所有含有消极情感的基准表情符号的第一微博组成消极情感集;
c、定义:新闻没有情感倾向,作为中性情感的微博,选取新浪微博中的新闻用户在两年中发布的微博,作为中性情感集中的中性微博,其中,选取的中性微博的数量与消极情感集和积极情感集中的第一微博之和相等;
步骤二、利用中性情感集、消极情感集和积极情感集,建立中性情感贝叶斯分类器;利用由消极情感集和积极情感集,建立极性情感贝叶斯分类器;
步骤三、利用中性情感贝叶斯分类器和极性情感贝叶斯分类器对待测微博进行情感分类,具体为:若待测微博中含有表情符号,则提取待测微博中的表情符号为待测表情符号,将待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号对比,若待测微博中只含有与积极情感集中的基准表情符号匹配的待测表情符号或只含有与消极情感集中的基准表情符号匹配的待测表情符号,则定义该待测微博为的情感为与该待测微博中含有的表情符号的情感倾向相同的情感倾向,
若待测微博中的待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号均不匹配,则利用中性情感贝叶斯感情分类器判断待测微博是否为中性微博,若待测微博为中性微博则中性情感贝叶斯感情分类器定义该待测微博为中性微博,若待测微博不是中性微博,则极性情感贝叶斯分类器将该待测微博分类,将该待测微博定义为积极情感微博或消极情感微博。
优选的是,所述的利用表情符号对微博进行情感倾向分类的方法中,所述步骤二中,创建中性情感贝叶斯分类器的具体步骤为:
d、从积极情感集、消极情感集和中性情感集中选取数量相等的第一微博和中性微博作为第一基础集,将第一基础集中的第一微博和中性微博的数量按9:1拆分,将9份第一微博和中性微博的作为第一训练集,将1份第一微博和中性微博作为第一测试集;
e、利用简易中文分词系统将第一训练集中的第一微博和中性微博进行分词得到第一关键词,得到的所有第一关键词组成第一词典,去除第一词典中的停用的第一关键词、出现次数小于等于3次的第一关键词和在第一训练集的所有第一微博和中性微博中出现频率高于80%的第一关键词,剩余的第一关键词组成中性情感词典;
f、将第一训练集中的中性微博与第一训练集中的第一微博的先验概率设定为0.5,建立中性情感贝叶斯分类模型,得到中性情感词典中各个第一关键词对中性情感、消极情感和积极情感的权重,得到中性情感贝叶斯分类器。
优选的是,所述的利用表情符号对微博进行情感倾向分类的方法中,所述步骤二中,创建极性情感贝叶斯分类器的具体步骤为:
h、从积极情感集和消极情感集中分别选取数量相等的第一微博作为第二基础集,将第二基础集中的第一微博的数量按9:1拆分,将9份第一微博作为第二训练集,将1份第一微博作为第二测试集,其中第二训练集中,包含积极情感的基准表情符号的第一微博的数量与包含消极情感的基准表情符号的第一微博的数量相等;
i、利用简易中文分词系统将第二训练集中的第一微博进行分词得到第二关键词,得到的所有第二关键词组成第二词典,去除第二词典中的停用的第二关键词、出现次数小于等于3次的第二关键词和在第二训练集的所有第一微博中出现频率高于80%的第二关键词,剩余的第二关键词组成极性情感词典;
k、将含有积极情感的表情符号的第一微博与含有消极感情的表情符号的第一微博的先验概率均设定为0.5,建立极性情感贝叶斯分类模型,得到极性情感词典中各个第二关键词对积极情感和消极情感的权重,得到极性情感贝叶斯分类器。
优选的是,所述的利用表情符号对微博进行情感倾向分类的方法中,m=600~700,n=9000~11000,p=80~110。
本发明设计了一种利用表情符号对微博进行情感倾向分类的方法,其通过官方新闻用户的微博得到中性情感集,利用表情符号标注积极情感集合消极情感集,进而建立一个两阶段分类,即建立中性情感分类器,把中性情感的微博剔除,建立极性情感分类器,将有极性情感的微博分为积极情感和消极情感,该分类器分类速度快、占用空间小且鲁棒,其中对积极微博分类准确率达79.2%,召回率为75.1%,F-measure为77.1%;对消极微博分类准确率达76.3%,召回率为80.3%,F-measure为78.27%。本发明能通过微博准确的了解到人们对当前的热门话题或事件的态度和网民的情绪,对社会科研和调查有着重要的帮助。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
如图1所示,本发明提供一种利用表情符号对微博进行情感倾向分类的方法,包括:
步骤一、创建中性情感集、消极情感集和积极情感集,具体为:
a、选取在2011和2012年中的新浪微博中使用次数超过20万次的表情符号624个,作为种子表情符号,对选取的每个种子表情符号都抽取包含这个表情符号的微博n条作为第一微博集,每个第一微博集包含10000条第一微博,从624×10000条第一微博的文本中提取重现性在前100的词作为高频词,对每个种子表情符号都选取包含有这个表情符号的微博100条作为第二微博集,每个第二微博集包含100条第二微博,观察这624×100条第二微博文本内容,若一条第二微博中包含的高频词与该条第二微博的文本的情感倾向一致,则认为该条第二微博中包含的种子表情符号的情感倾向明显,并提取该种子表情符号为基准表情符号,人工对基准表情符号非为积极情感和消极情感,以此能获得141个积极表情符号,94个消极表情符号;
b、所有积极情感的基准表情符号和所有含有积极情感的基准表情符号的第一微博组成积极情感集,所有消极情感的基准表情符号和所有含有消极情感的基准表情符号的第一微博组成消极情感集;
c、定义:新闻没有情感倾向,作为中性情感的微博,从新浪微博在2011年和2012年中的84个新闻用户发布的多条新闻微博作为中性情感集中的中性微博,其中,选取的中性微博的数量与消极情感集和积极情感集中的第一微博之和相等;
步骤二、利用中性情感集、消极情感集和积极情感集,建立中性情感贝叶斯分类器;利用由消极情感集和积极情感集,建立极性情感贝叶斯分类器;
具体为:
中性情感贝叶斯分类器的建立:
从积极情感集、消极情感集和中性情感集中选取数量相等的第一微博和中性微博作为第一基础集,将第一基础集中的第一微博和中性微博的数量按9:1拆分,将9份第一微博和中性微博的作为第一训练集,将1份第一微博和中性微博作为第一测试集;
e、利用开源分词程序SCWS将第一训练集中的第一微博和中性微博进行分词得到第一关键词,得到的所有第一关键词组成第一词典,去除第一词典中的停用的第一关键词、出现次数小于等于3次的第一关键词和在第一训练集的所有第一微博和新闻微博中出现频率高于80%的第一关键词,剩余的第一关键词组成中性情感词典;
f、将第一训练集中的中性微博与第一训练集中的第一微博的先验概率设定为0.5,建立中性情感贝叶斯分类模型,得到中性情感词典中各个第一关键词对中性情感、消极情感和积极情感的权重,得到中性情感分类器,如公式(1)所示:
s ( t ) = argmax j ( P ( s j ) Π i = 1 d p ( w i | s j ) ) - - - ( 1 ) ,
其中,s(t)表示待测微博t的情感倾向,定义任意一条待测微博t为t=(w1,...,wi,...,wd),其中wi表示中性情感词典中第i个第一关键词在t待测微博中出现的次数,sj在中性情感分类器中表示中性情感/消极或积极情感类别,P(sj)为sj的先验概率,p(wi|sj)表示wi的经验分布,该分部可以通过第一训练集训练得到,其中n(wi,sj)为第一关键词wi在sj类情感集中出现的次数;
利用十折交叉检验得到该分类模型对积极微博分类准确率达79.2%%,召回率为75.1%,F-measure为77.1%;对消极微博分类准确率达76.3%,召回率为80.3%,F-measure为78.27%。
极性情感贝叶斯分类器的建立:
h、从积极情感集和消极情感集中分别选取数量相等第一微博作为第二基础集,将第二基础集中的第一微博的数量按9:1拆分,将9份第一微博作为第二训练集,将1份第一微博作为第二测试集,其中第二训练集中包含积极情感的基准表情符号的第一微博的数量与包含消极情感的基准表情符号的第一微博的数量相等;
i、利用开源分词程序SCWS将第二训练集中的第一微博进行分词得到第二关键词,所有第二关键词组成的第二词典,去除第二词典中的停用的第二关键词、出现次数小于等于3次的第二关键词和在第二训练集中的所有第一微博中出现频率高于80%的第二关键词,剩余的第二关键词组成极性情感词典;
k、将含有积极情感的表情符号的第一微博与含有消极感情的表情符号的第一微博的先验概率均设定为0.5,建立极性情感贝叶斯分类模型,得到极性情感词典中各个第二关键词对积极情感和消极情感的权重,得到极性情感分类器,如公式(2)所示,
s ( t ) = argmax j ( P ( s j ) Π i = 1 d p ( w i | s j ) ) - - - ( 2 ) ,
其中s(t)表示待测微博t的情感倾向,定义待测微博t为t=(w1,...,wi,...,wd),其中wi表示极性情感词典中第i个第二关键词在该待测微博中出现的次数,sj在极性情感分类器中表示积极情感类别或消极情感类别,P(sj)为sj的先验概率,p(wi|sj)表示wi的经验分布,该分部可以通过第二训练集训练得到,其中n(wi,sj)为第二关键词wi在sj类情感集中出现的次数;利用十折交叉检验得到该分类模型对积极微博分类准确率达79.2%%,召回率为75.1%,F-measure为77.1%;对消极微博分类准确率达76.3%,召回率为80.3%,F-measure为78.27%。
步骤三、利用中性情感贝叶斯分类器和极性情感贝叶斯分类器对待测微博进行情感分类,具体为:若待测微博中含有表情符号,则提取待测微博中的表情符号为待测表情符号,将待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号对比,若待测微博中只含有与积极情感集中的基准表情符号匹配的待测表情符号或只含有与消极情感集中的基准表情符号匹配的待测表情符号,则定义该待测微博为的情感为与该待测微博中含有的表情符号的情感倾向相同的情感倾向,
若待测微博中的待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号均不匹配,则利用中性情感贝叶斯感情分类器判断待测微博是否为中性微博,若待测微博为中性微博则中性情感贝叶斯感情分类器定义该待测微博为中性微博,若待测微博不是中性微博,则极性情感贝叶斯分类器将该待测微博分类,将该待测微博定义为积极情感微博或消极情感微博。
本发明设计了一种利用表情符号对微博进行情感倾向分类的方法,其通过官方新闻用户的微博得到中性情感集,利用表情符号标注积极情感集合消极情感集,进而建立一个两阶段分类,即建立中性情感分类器,把中性情感的微博剔除,建立极性情感分类器,将有极性情感的微博分为积极情感和消极情感,该分类器速度快、占用空间小且鲁棒的情感分类器,该情感分类器能准确快速的进行情感分类,其中对积极微博分类准确率达79.2%,召回率为75.1%,F-measure为77.1%;对消极微博分类准确率达76.3%,召回率为80.3%,F-measure为78.27%。本发明能通过微博准确的了解到人们对当前的热门话题或事件的态度和网民的情绪,对社会科研和调查有着重要的帮助。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。

Claims (4)

1.一种利用表情符号对微博进行情感倾向分类的方法,其特征在于,包括:
步骤一、创建中性情感集、消极情感集和积极情感集,具体为:
a、选取在两年中的新浪微博中使用次数超过20万次的表情符号m个,作为种子表情符号,对选取的每个种子表情符号都抽取包含这个表情符号的微博n条作为第一微博集,每个第一微博集包含n条第一微博,从m×n条第一微博的文本中提取重现性在前100的词作为高频词,对每个种子表情符号都选取包含有这个表情符号的微博p条,作为第二微博集,每个第二微博集包含p条第二微博,观察m×p条第二微博文本内容,若一条第二微博中包含的高频词与该条第二微博的文本的情感倾向一致,则认为该条第二微博中包含的种子表情符号的情感倾向明显,并提取该条第二微博中的种子表情符号作为基准表情符号,人工将基准表情符号分类为积极情感和消极情感;
b、所有积极情感的基准表情符号和所有含有积极情感的基准表情符号的第一微博组成积极情感集,所有消极情感的基准表情符号和所有含有消极情感的基准表情符号的第一微博组成消极情感集;
c、定义:新闻没有情感倾向,作为中性情感的微博,选取新浪微博中的新闻用户在两年中发布的微博,作为中性情感集中的中性微博,其中,选取的中性微博的数量与消极情感集和积极情感集中的第一微博之和相等;
步骤二、利用中性情感集、消极情感集和积极情感集,建立中性情感贝叶斯分类器;利用由消极情感集和积极情感集,建立极性情感贝叶斯分类器;
步骤三、利用中性情感贝叶斯分类器和极性情感贝叶斯分类器对待测微博进行情感分类,具体为:若待测微博中含有表情符号,则提取待测微博中的表情符号为待测表情符号,将待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号对比,若待测微博中只含有与积极情感集中的基准表情符号匹配的待测表情符号或只含有与消极情感集中的基准表情符号匹配的待测表情符号,则定义该待测微博为的情感为与该待测微博中含有的表情符号的情感倾向相同的情感倾向,
若待测微博中的待测表情符号与积极情感集中的基准表情符号和消极情感集中的基准表情符号均不匹配,则利用中性情感贝叶斯感情分类器判断待测微博是否为中性微博,若待测微博为中性微博则中性情感贝叶斯感情分类器定义该待测微博为中性微博,若待测微博不是中性微博,则极性情感贝叶斯分类器将该待测微博分类,将该待测微博定义为积极情感微博或消极情感微博。
2.如权利要求1所述的利用表情符号对微博进行情感倾向分类的方法,其特征在于,所述步骤二中,创建中性情感贝叶斯分类器的具体步骤为:
d、从积极情感集、消极情感集和中性情感集中选取数量相等的第一微博和中性微博作为第一基础集,将第一基础集中的第一微博和中性微博的数量按9:1拆分,将9份第一微博和中性微博的作为第一训练集,将1份第一微博和中性微博作为第一测试集;
e、利用简易中文分词系统将第一训练集中的第一微博和中性微博进行分词得到第一关键词,得到的所有第一关键词组成第一词典,去除第一词典中的停用的第一关键词、出现次数小于等于3次的第一关键词和在第一训练集的所有第一微博和中性微博中出现频率高于80%的第一关键词,剩余的第一关键词组成中性情感词典;
f、将第一训练集中的中性微博与第一训练集中的第一微博的先验概率设定为0.5,建立中性情感贝叶斯分类模型,得到中性情感词典中各个第一关键词对中性情感、消极情感和积极情感的权重,得到中性情感贝叶斯分类器。
3.如权利要求1所述的利用表情符号对微博进行情感倾向分类的方法,其特征在于,所述步骤二中,创建极性情感贝叶斯分类器的具体步骤为:
h、从积极情感集和消极情感集中分别选取数量相等的第一微博作为第二基础集,将第二基础集中的第一微博的数量按9:1拆分,将9份第一微博作为第二训练集,将1份第一微博作为第二测试集,其中第二训练集中,包含积极情感的基准表情符号的第一微博的数量与包含消极情感的基准表情符号的第一微博的数量相等;
i、利用简易中文分词系统将第二训练集中的第一微博进行分词得到第二关键词,得到的所有第二关键词组成第二词典,去除第二词典中的停用的第二关键词、出现次数小于等于3次的第二关键词和在第二训练集的所有第一微博中出现频率高于80%的第二关键词,剩余的第二关键词组成极性情感词典;
k、将含有积极情感的表情符号的第一微博与含有消极感情的表情符号的第一微博的先验概率均设定为0.5,建立极性情感贝叶斯分类模型,得到极性情感词典中各个第二关键词对积极情感和消极情感的权重,得到极性情感贝叶斯分类器。
4.如权利要求1~3任意一项所述的利用表情符号对微博进行情感倾向分类的方法,其特征在于,m=600~700,n=9000~11000,p=80~110。
CN201310664725.6A 2013-12-09 2013-12-09 一种利用表情符号对微博进行情感倾向分类的方法 Active CN103761239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310664725.6A CN103761239B (zh) 2013-12-09 2013-12-09 一种利用表情符号对微博进行情感倾向分类的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310664725.6A CN103761239B (zh) 2013-12-09 2013-12-09 一种利用表情符号对微博进行情感倾向分类的方法

Publications (2)

Publication Number Publication Date
CN103761239A CN103761239A (zh) 2014-04-30
CN103761239B true CN103761239B (zh) 2016-10-26

Family

ID=50528479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310664725.6A Active CN103761239B (zh) 2013-12-09 2013-12-09 一种利用表情符号对微博进行情感倾向分类的方法

Country Status (1)

Country Link
CN (1) CN103761239B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104063427A (zh) * 2014-06-06 2014-09-24 北京搜狗科技发展有限公司 一种基于语义理解的表情输入方法和装置
CN104216873B (zh) * 2014-08-27 2017-02-15 华中师范大学 一种分析情绪障碍患者网络留言情感波动特征的方法
CN104794208A (zh) * 2015-04-24 2015-07-22 清华大学 基于微博文本上下文信息的情绪分类方法及系统
CN104794209B (zh) * 2015-04-24 2018-10-02 清华大学 基于马尔科夫逻辑网络的中文微博情绪分类方法及系统
US20170213138A1 (en) * 2016-01-27 2017-07-27 Machine Zone, Inc. Determining user sentiment in chat data
CN106294326B (zh) * 2016-08-23 2018-11-09 成都科来软件有限公司 一种新闻报道情感倾向分析方法
CN107943800A (zh) * 2016-10-09 2018-04-20 郑州大学 一种微博话题舆情计算与分析的方法
CN107066442A (zh) * 2017-02-15 2017-08-18 阿里巴巴集团控股有限公司 情绪值的检测方法、装置及电子设备
CN107391581A (zh) * 2017-06-21 2017-11-24 清华大学 社会网络信息传播行为预测方法和设备
CN107357899B (zh) * 2017-07-14 2020-05-22 吉林大学 基于和积网络深度自动编码器的短文本情感分析方法
CN107423408B (zh) * 2017-07-28 2020-10-23 广州多益网络股份有限公司 一种微博文本跨领域情感分析方法及系统
CN108681532B (zh) * 2018-04-08 2022-03-25 天津大学 一种面向中文微博的情感分析方法
CN109214454B (zh) * 2018-08-31 2021-07-06 东北大学 一种面向微博的情感社区分类方法
CN110309308A (zh) * 2019-06-27 2019-10-08 北京金山安全软件有限公司 一种文字信息的分类方法、装置及电子设备
CN110297907B (zh) * 2019-06-28 2022-03-08 谭浩 生成访谈报告的方法、计算机可读存储介质和终端设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279890A (zh) * 2011-09-02 2011-12-14 苏州大学 基于微博的情感词提取收集方法
CN103077207A (zh) * 2012-12-28 2013-05-01 深圳先进技术研究院 一种微博开心指数分析方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102279890A (zh) * 2011-09-02 2011-12-14 苏州大学 基于微博的情感词提取收集方法
CN103077207A (zh) * 2012-12-28 2013-05-01 深圳先进技术研究院 一种微博开心指数分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Ranking social emotions by learning listwise preference;Qishen Wang et;《Pattern Recognition(ACPR)》;20111128;全文 *

Also Published As

Publication number Publication date
CN103761239A (zh) 2014-04-30

Similar Documents

Publication Publication Date Title
CN103761239B (zh) 一种利用表情符号对微博进行情感倾向分类的方法
Ciot et al. Gender inference of Twitter users in non-English contexts
Thakkar et al. Approaches for sentiment analysis on twitter: A state-of-art study
CN106055538B (zh) 主题模型和语义分析相结合的文本标签自动抽取方法
CN103150367B (zh) 一种中文微博的情感倾向分析方法
Saif et al. Alleviating data sparsity for twitter sentiment analysis
CN105045857A (zh) 一种社交网络谣言识别方法及系统
Tago et al. Influence analysis of emotional behaviors and user relationships based on Twitter data
CN102682120B (zh) 一种网络评论精华文本的获取方法和装置
CN107609103A (zh) 一种基于推特的事件检测方法
CN104899335A (zh) 一种对网络舆情信息进行情感分类的方法
Bora Summarizing public opinions in tweets
CN106126502A (zh) 一种基于支持向量机的情感分类系统及方法
CN103577405A (zh) 基于兴趣分析的微博博主社区分类方法
Bansal et al. Code-switching patterns can be an effective route to improve performance of downstream NLP applications: A case study of humour, sarcasm and hate speech detection
CN105447144B (zh) 基于大数据分析技术的微博转发可视化分析方法及系统
Benny et al. Keyword based tweet extraction and detection of related topics
CN106547875A (zh) 一种基于情感分析和标签的微博在线突发事件检测方法
Qiu et al. Advanced sentiment classification of tibetan microblogs on smart campuses based on multi-feature fusion
CN105224955A (zh) 基于微博大数据获取网络服务状态的方法
Tembhurnikar et al. Topic detection using BNgram method and sentiment analysis on twitter dataset
Verhoeven et al. Gender profiling for Slovene Twitter communication: The influence of gender marking, content and style
CN104123336B (zh) 深度玻尔兹曼机模型及短文本主题分类系统和方法
CN103810170A (zh) 交流平台文本分类方法及装置
Hedar et al. Mining social networks arabic slang comments

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant