CN111027328B - 通过语料训练判断评论情绪正负及感情色彩的方法 - Google Patents
通过语料训练判断评论情绪正负及感情色彩的方法 Download PDFInfo
- Publication number
- CN111027328B CN111027328B CN201911089294.9A CN201911089294A CN111027328B CN 111027328 B CN111027328 B CN 111027328B CN 201911089294 A CN201911089294 A CN 201911089294A CN 111027328 B CN111027328 B CN 111027328B
- Authority
- CN
- China
- Prior art keywords
- negative
- positive
- event
- comments
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 title claims abstract description 12
- 238000012549 training Methods 0.000 title claims abstract description 12
- 238000011156 evaluation Methods 0.000 claims abstract description 11
- 230000036651 mood Effects 0.000 claims abstract description 4
- 239000003086 colorant Substances 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明属信息收集领域,尤其是一种通过语料训练判断评论情绪正负及感情色彩的方法,针对现有的面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度的问题,现提出如下方案,其包括S1:在网上收集语料数据;S2:收集社会主流事件,其中包括正面事件和负面事件;S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号,本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
Description
技术领域
本发明信息收集涉及技术领域,尤其涉及一种通过语料训练判断评论情绪正负及感情色彩的方法。
背景技术
随着用户参与互联网新闻事件机会越来越多,用户更愿意通过文章的评论来表达用户自己的观点及感悟色彩,通过用户的评论表达的观点来获取用户对某事件,机构或者人物的主要口碑评价。
现有的在对某一事件进行评论时,往往会有正面态度或者反面态度进行评价,但目前很多情况下,面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度,所以我们提出通过语料训练判断评论情绪正负及感情色彩的方法,用于解决上述所提出的问题。
发明内容
基于背景技术存在面对无论正面事件或者反面事件都会存在正面或者负面的评价,所以无法判别人们在对事件的正确的态度的技术问题,本发明提出了通过语料训练判断评论情绪正负及感情色彩的方法。
本发明提出的通过语料训练判断评论情绪正负及感情色彩的方法,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别统计在正面事件中整理正面评论和负面评论和在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度。
优选地,所述S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上。
优选地,所述S2中,社会主流事件为为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准。
优选地,所述S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
优选地,所述S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的评率高,则判定为负面事件。
优选地,所述S6中,将收集后的评论后与词库内的词语进行比对,以此可以得出正面评论和负面评论。
优选地,所述S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论可以对此事件的态度。
优选地,所述S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
本发明的有益效果:
首先经过制作词库、收集事件等操作,并将事件与词库进行比对,以此可以将事件划分为正面事件和负面事件,接着收集对事件的评论语句,并且与词库进行对比,以此得出对事件的正面评论和负面评论;
以正面事件或者负面事件作为依据,分别收集正面事件别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度,之后将正面事件内的正面评论和负面评论进行对比或者负面事件内的正面评论和负面评论进行对比,并以图表的形式进行呈现,以此方便得出人们分别在正面事件或者负面事件的态度,并且可以根据态度的本身体现出社会价值观的走向。
本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
具体实施方式
下面结合具体实施例对本发明作进一步解说。
通过语料训练判断评论情绪正负及感情色彩的方法,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别统计在正面事件中整理正面评论和负面评论和在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度。
本实施例中,S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上。
本实施例中,S2中,社会主流事件为为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准。
本实施例中,S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
本实施例中,S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的评率高,则判定为负面事件。
本实施例中,S6中,将收集后的评论后与词库内的词语进行比对,以此可以得出正面评论和负面评论。
本实施例中,S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论可以对此事件的态度。
本实施例中,S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
首先经过制作词库、收集事件等操作,并将事件与词库进行比对,以此可以将事件划分为正面事件和负面事件,接着收集对事件的评论语句,并且与词库进行对比,以此得出对事件的正面评论和负面评论,以正面事件或者负面事件作为依据,分别收集正面事件别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度,之后将正面事件内的正面评论和负面评论进行对比或者负面事件内的正面评论和负面评论进行对比,并以图表的形式进行呈现,以此方便得出人们分别在正面事件或者负面事件的态度,并且可以根据态度的本身体现出社会价值观的走向,本发明通过利用词库分别对正面评论和负面评论进行对比和判别,以此可以方便得出人们在正面事件或者负面事件态度,进一步可以有效的体现社会价值观的走向。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
Claims (5)
1.通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,包括以下步骤:
S1:在网上收集语料数据;
S2:收集社会主流事件,其中包括正面事件和负面事件;
S3:制作词库,包括同义词、同音错别字词、标准词、语气词和表情符号;
S4:依据社会主流事件内的文字,与词库内的词语进行比对,以此可以判别此社会主流事件为正面事件和负面事件;
S5:监测和收集网上对主流事件评论的语句;
S6:分别在正面事件中整理正面评论和负面评论,在负面事件中整理正面评论和负面评论;
S7:将正面事件或负面事件作为依据,分别对其进行评论的语句进行检测,以此可以根据分别划分对正面事件或者负面事件的评论者的积极态度或者消极态度;
S8:将正面评论和负面评论形成对比,以此可以得出人们对此事件的积极态度或者消极态度,所述S1中,语料数据量要及时性,时间范围为近一年的,覆盖事件的评论量够大,范围为100万以上,所述S2中,社会主流事件为传播范围广,并以网络传播度、电视台、电台和报纸为评判标准,所述S3中,以网络评论词汇为主,并且经过各个文字输入软件作为收集载体,以此方便词库的更新速度。
2.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S4中,对主流事件进行中的文字与词库中的文字、词语进行一一对比,若是积极的文字出现频率高,则可判定为正面事件,若是消极的文字出现的频率高,则判定为负面事件。
3.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S6中,将收集后的评论与词库内的词语进行比对,以此可以得出正面评论和负面评论。
4.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S7中,将正面事件和负面事件分别作为评判的基准,通过正面评论和负面评论得到评论者对此事件的态度。
5.根据权利要求1所述的通过语料训练判断评论情绪正负及感情色彩的方法,其特征在于,所述S8中,正面评论和负面评论以图表的形式进行呈现,方便进行观看。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911089294.9A CN111027328B (zh) | 2019-11-08 | 2019-11-08 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911089294.9A CN111027328B (zh) | 2019-11-08 | 2019-11-08 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111027328A CN111027328A (zh) | 2020-04-17 |
CN111027328B true CN111027328B (zh) | 2024-03-26 |
Family
ID=70205081
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911089294.9A Active CN111027328B (zh) | 2019-11-08 | 2019-11-08 | 通过语料训练判断评论情绪正负及感情色彩的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111027328B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234431A (ja) * | 2007-03-22 | 2008-10-02 | Toshiba Corp | コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム |
CN107305545A (zh) * | 2016-04-18 | 2017-10-31 | 南京理工大学 | 一种基于文本倾向性分析的网络意见领袖的识别方法 |
CN108665339A (zh) * | 2018-03-27 | 2018-10-16 | 北京航空航天大学 | 一种基于主观情感测度的电商产品可靠性指标及其实现方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8296168B2 (en) * | 2006-09-13 | 2012-10-23 | University Of Maryland | System and method for analysis of an opinion expressed in documents with regard to a particular topic |
US20080215571A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Product review search |
CN103679462B (zh) * | 2012-08-31 | 2019-01-15 | 阿里巴巴集团控股有限公司 | 一种评论数据处理方法和装置、一种搜索方法和系统 |
CN104090864B (zh) * | 2014-06-09 | 2018-02-06 | 合肥工业大学 | 一种情感词典建立与情感计算方法 |
CN104933130A (zh) * | 2015-06-12 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 评论信息的标注方法及装置 |
CN106649519B (zh) * | 2016-10-17 | 2020-11-27 | 北京邮电大学 | 一种产品特征的挖掘与评价方法 |
CN107315778A (zh) * | 2017-05-31 | 2017-11-03 | 温州市鹿城区中津先进科技研究院 | 一种基于大数据情感分析的自然语言舆情分析方法 |
-
2019
- 2019-11-08 CN CN201911089294.9A patent/CN111027328B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008234431A (ja) * | 2007-03-22 | 2008-10-02 | Toshiba Corp | コメント蓄積装置、コメント作成閲覧装置、コメント閲覧システムおよびプログラム |
CN107305545A (zh) * | 2016-04-18 | 2017-10-31 | 南京理工大学 | 一种基于文本倾向性分析的网络意见领袖的识别方法 |
CN108665339A (zh) * | 2018-03-27 | 2018-10-16 | 北京航空航天大学 | 一种基于主观情感测度的电商产品可靠性指标及其实现方法 |
Non-Patent Citations (2)
Title |
---|
网络舆论事件中微博评论情感倾向及程度研究――以"于欢案"为例;杨帆;;传媒观察;20181110(第11期);全文 * |
面向互联网评论情感分析的中文主观性自动判别方法研究;叶强;张紫琼;罗振雄;;信息系统学报;20071115(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111027328A (zh) | 2020-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103699626B (zh) | 一种微博用户个性化情感倾向分析方法及系统 | |
CN107644089B (zh) | 一种基于网络媒体的热门事件提取方法 | |
Qian et al. | Changing patterns of interracial marriage in a multiracial society | |
Buchstaller | Diagnostics of age‐graded linguistic behaviour: The case of the quotative system 1 | |
CN106503049A (zh) | 一种基于svm融合多种情感资源的微博情感分类方法 | |
CN102945268A (zh) | 产品特征评论挖掘方法及系统 | |
Davis | Hashtag politics: the polyphonic revolution of# Twitter | |
CN106250513A (zh) | 一种基于事件建模的事件个性化分类方法及系统 | |
Kwon et al. | The influence of smartphone addiction on depression and communication competence among college students | |
CN106354845A (zh) | 基于传播结构的微博谣言识别方法和系统 | |
CN104636425A (zh) | 一种网络个体或群体情绪认知能力预测与可视化方法 | |
CN104331394A (zh) | 一种基于观点的文本分类方法 | |
CN112001184B (zh) | 面向视频弹幕的用户情感差异区域检测方法和系统 | |
Clancy | Complementary perspectives on hedging behaviour in family discourse: The analytical synergy of variational pragmatics and corpus linguistics | |
CN104899335A (zh) | 一种对网络舆情信息进行情感分类的方法 | |
CN106202200B (zh) | 一种基于固定主题的文本情感倾向性分类方法 | |
CN109766452A (zh) | 一种基于社交数据的人物性格分析方法 | |
Sonalitha et al. | Combined text mining: Fuzzy clustering for opinion mining on the traditional culture arts work | |
CN107480136A (zh) | 一种应用于电影剧本中情感曲线分析的方法 | |
CN108388624A (zh) | 多媒体信息推荐方法及装置 | |
US10296530B2 (en) | Identifying entity representatives for topics reflected in content items using natural language processing | |
CN104572915A (zh) | 一种基于内容环境增强的用户事件相关度计算方法 | |
CN111027328B (zh) | 通过语料训练判断评论情绪正负及感情色彩的方法 | |
CN103116651A (zh) | 一种舆情热点动态检测方法 | |
CN105718444A (zh) | 基于新闻语料的金融概念对应股票关联方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |